关于区分度不高的字段,比如性别,比如状态字段,是否应该建索引?
只有2种取值的字段,建了索引数据库也不一定会用,只会白白增加索引维护的额外开销,因为索引也是需要存储的,所以插入和更新的写入操作,同时需要插入和更新你这个字段的索引的.
所以说,唯一性太差的字段不需要创建索引,即便用于where条件.
相关,建立联合索引时,也要考虑把重复率低而又用得多的列放在前面.
比如: key (attr_id, attr_value)
联合索引左匹配:单查 attr_id 也能使用索引,单查 attr_value 将无法利用该联合索引.
那么把区分度不高(唯一性不高)的字段和区分度高的字段(唯一性高)的字段一起做联合索引呢?
看情况,举个例子,如果仅仅是男女,数据55开的,或者是只有1,2,3三种状态的且相对平均分布的,这种情况下索引是没用的(用不到的)
如果可以根据筛选条件过滤出来一个小的结果集,当然可以建索引
比如表中状态位有1,2,3,4,5,6,7,8,9等等,3,4,5,6,7,8,9占据了大部分数据,1,2只有少部分数据,当然可以在这个字段上建索引
对于3,4,5,6,7,8,9的查询可能不适用与索引查询,但是对于1,2就适合索引查找,那么此时建立个索引页无可厚非。
这种情况,应该和其他的查询条件用到的字段,建立联合索引,而不是建立单列索引;
比如这样的查询比较多:
select * from t where crdate > '2017-01-01' and sexid = '男'
可以建立如下索引:
create index ix_t on t(crdate, sexid)