发布日期:2024-02-28 来源: 网络 阅读量()
- 原理 - 采样统计的时候,InnoDB 默认会选择 N 个数据页,统计这些页面上的不同值,得到一个平均值,然后乘以这个索引的页面数,就得到了这个索引的基数。 - 而数据表是会持续更新的,索引统计信息也不会固定不变。所以,当变更的数据行数超过 1/M 的时候,会自动触发重新做一次索引统计。 - 为什么需要使用 采样统计? - 因为把整张表取出来一行行统计,虽然可以得到精确的结果,但是代价太高了,所以只能选择“采样统计”。 - 在 MySQL 中,有两种存储索引统计的方式,可以通过设置参数 innodb_stats_persistent 的值来选择: - 设置为 on 的时候,表示统计信息会持久化存储。这时,默认的 N 是 20,M 是 10。 - 设置为 off 的时候,表示统计信息只存储在内存中。这时,默认的 N 是 8,M 是 16。 - 由于是采样统计,所以不管 N 是 20 还是 8,这个基数都是很容易不准的。 五:索引选择异常的问题可以有哪几种处理方式? - 重新统计索引信息 - 既然是统计信息不对,那就修正。analyze table t 命令,可以用来重新统计索引信息。 - 指定使用索引 - select * from table force index(`index_name`);