前段时间写数据库内核比较多,最近又有朋友问索引的应用了,其实相关索引应用之前或多或少写过,只是可能不这么系统,这一篇简单总结一下,并系统性补充一些概念。
画外音:本文基于MySQL5.6。
什么是聚集索引,非聚集索引?
详见《聚集索引,普通索引的差异》。
索引底层数据结构如何?
详见《数据库索引,到底是什么做的?》。
InnoDB到底支不支持hash索引?
详见《InnoDB到底支不支持哈希索引?》。
什么是回表查询,索引的覆盖?
详见《如何避免回表查询?什么是索引覆盖?》。
什么是联合索引?
多个字段上建立的索引,能够加速复核查询条件的检索。
举例,登录业务需求:
select uid, login_time from t_user where
login_name=? and passwd=?
可以建立(login_name, passwd)的联合索引。
联合索引能够满足最左侧查询需求,例如(a, b, c)三列的联合索引,能够加速a | (a, b) | (a, b, c) 三组查询需求。
这也就是为何不建立(passwd, login_name)这样联合索引的原因,业务上几乎没有passwd的单条件查询需求,而有很多login_name的单条件查询需求。
SQL语句里,where条件中的and前后的顺序,是否会影响索引的命中?
不会(这是很多朋友容易搞错的地方)。
举个例子:
select uid, login_time from t_user where
passwd=? and login_name=?
能否命中(login_name, passwd)这个联合索引?
可以,最左侧查询需求,并不是指SQL语句的写法必须满足索引的顺序。
主键与唯一索引约束是啥?
详见《MySQL不为人知的主键与唯一索引约束》,很多人经常在这里采坑。
类型不匹配,字符编码不匹配,会不会对索引命中产生影响?
会,详见《两类非常隐蔽的全表扫描,不能命中索引》,介绍得比较详细。
负向查询,IN,OR,UNION哪些会对索引命中有影响?
举个例子:
假设订单业务表结构为:
order(oid, date, uid, status, money, time,…)
相关字段上也建立了索引。
假设订单有三种状态:0已下单,1已支付,2已完成
业务需求,查询未完成的订单,哪个SQL更快呢?
(1)select * from order where status!=2
(2)select * from order where status IN(0,1)
(3)select * from order where status=0 or status=1
(4)select * from order where status=0
union all
select * from order where status=1
第一个:select * from order where status!=2
负向查询肯定不可以命中索引,无争议。
画外音:
前导模糊查询,像like '%XX'是同样的道理,无法命中索引;
非前导模糊查询,像like 'XX%',则可以命中索引。
最后一个:
select * from order where status=0
union all
select * from order where status=1
两个SQL结果集合并,肯定可以命中status索引,无争议。
IN查询:
select * from order where status in (0,1)
explain下试试看?是可以命中索引的。
OR查询:
select * from order where status=0 or status=1
新版MySQL,可以优化为IN查询,故也是可以命中索引的。
其他一些实践:
(1)数据区分度不大的字段,不宜使用索引。
例如:
select * from user where sex=1
因为,性别只有男,女,每次过滤掉的数据很少,性能和全表扫描差不多。
(2)属性上的计算,不能命中索引。
select * from order where YEAR(date) < ='2019'
即使date上建立了索引,也会全表扫描,可优化为值计算:
select * from order where date < =CURDATE()
或者:
select * from order where date < ='2019-10-24'
后两者可以命中索引。
(3)如果列允许null值,查询会有巨大的坑。
例如:
select * from user where name != 'shenjian'
假设数据表有:
(1, shenjian)
(2, zhangsan)
(3, lisi)
(4, null)
你猜猜结果集中会包含哪些记录?
画外音:《数据库允许空值(null),往往是悲剧的开始》。
希望大家对索引有更系统性的认识。
架构师之路-分享技术思路
相关文章:
《缓冲池(buffer pool),彻底懂了!》
《写缓冲(change buffer),彻底懂了!》
1024,祝大家节日快乐!谢转。