文章目录
一. 背景
1. MySQL怎样选择索引?
- Server层的优化器决定使用哪个索引
- 根据语句扫描的行数、是否排序、是否存在临时表来判断选择哪个索引
2. Candinality
- 一个索引上不同值的个数,称为"基数",即Candinality。基数越大,索引的区分度越好
- MySQL 在真正开始执行语句之前,并不能精确地知道满足这个条件的记录有多少条,而只能根据统计信息来估算记录数,这个统计信息就是索引的"区分度"。
3. 采样统计
- 采样统计的时候,InnoDB 默认会选择 N 个数据页,统计这些页面上的不同值,得到一个平均值,然后乘以这个索引的页面数,就得到了这个索引的基数。
- 而数据表是会持续更新的,索引统计信息也不会固定不变。所以,当变更的数据行数超过 1/M 的时候(M是10则表示十分之一),会自动触发重新做一次索引统计。