1:查询频繁 2:区分度高 3:长度小 4: 尽量能覆盖常用查询字段.
1: 索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多).
针对列中的值,从左往右截取部分,来建索引
1: 截的越短, 重复度越高,区分度越小, 索引效果越不好
2: 截的越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大--增删改变慢,并间影响查询速度.
所以, 要在 区分度 + 长度 两者上,取得一个平衡.
惯用手法: 截取不同长度,并测试其区分度,
[sql] view plain copy
- <span style="font-size:18px;">select count(distinct left(word,6))/count(*) from dict;
- +---------------------------------------+
- | count(distinct left(word,6))/count(*) |
- +---------------------------------------+
- | 0.9992 |
- +---------------------------------------+</span>
截取word字段长度,从1开始截取,计算字符前缀没有重复的字符占全部数据的比例
对于一般的系统应用: 区别度能达到0.1,索引的性能就可以接受.