一、概念
索引的选择性是指:不重复的索引值(也称为基数,cardinality)和数据表的记录总数(T)的比值,范围从1/T ~ 1之间;索引的选择性越高则查询效率越高,因为选择性高的索引可以让MySQL在查找时过滤掉更多的行;唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。
二、几种查看索引列数据的分布情况,以设计高性能的索引
2.1 设计前缀索引,以确定合理合适的前缀长度
此外计算合适的前缀长度的另外一个方法:计算完整列的选择性,并使前缀的选择性接近完整列的选择性,如以下显示
也可以在一个查询中,针对不同前缀长度进行计算,这对于大表来说非常有益,如下图显示
2.2 多列索引,以确定索引列的顺序
在不需要考虑排序和分组时,将选择性最高的列(字段)放在前面通常是很好的,此时索引的作用只是优化查询语句中的WHERE条件,按这个原则设计的索引能最快过滤出需要的行
以上统计是根据经验法则,不考虑WHERE条件具体值的分布,而是考虑全局基数和选择性
以上就是考虑WHERE条件的具体值的数据分布情况了