联合索引,回表,索引覆盖

今天学习到了一点知识,来做一下笔记~



建立联合索引时,为什么要关注列的顺序?

mysql建立联合索引有最左前置原则,在建立联合索引时,根据需求,where子句中使用最频繁的一列放在最左边;


如何理解联合索引中遵守的最左前置原则?

mysql默认的存储引擎是InnoDB,InnoDB使用B+树,B+树的数据项是复合的数据结构,是按照从左到右的顺序来建立搜索树的。

比如当(AA,BB,CC)这样的数据来检索的时候,b+树会优先比较AA来确定下一步的所搜方向,如果AA相同再依次比较BB和CC,最后得到检索的数据;

但当(BB,CC)这样的没有AA的数据来的时候,b+树就不知道第一步该查哪个节点,因为建立搜索树的时候AA就是第一个比较因子,必须要先根据AA来搜索才能知道下一步去哪里查询。

当(AA,CC)这样的数据来检索时,b+树可以用AA来指定搜索方向,但下一个字段BB的缺失,所以只能把名字等于AA的数据都找到,然后再匹配CC这种情况无法用到联合索引。



什么是回表操作,索引覆盖的意义?


回表操作:执行一条sql语句,需要从两个b+树中取数据。

比如:建立了一个A,B联合索引,sql语句是 select A,B from table where A=?, B=?,此时想要搜索的A,B从索引数据中已经存在了,不用拿到id到表数据中去查找,此时便不会回表,这种现象就叫做索引覆盖。

现在把语句改为了 select A,B,C from table where A=?, B=?,C不在索引数据中,所以只能先拿到id再到表数据文件中搜索,这就是回表。


覆盖索引就是从索引中直接获取查询结果,要使用覆盖索引需要注意select查询列中包含在索引列中,MySQL使用了覆盖索引进行查询。查询效率得到极大的提升。


mysql里创建‘联合索引’的意义?

  1. "一个顶三个"。建了一个(a,b,c)的复合索引,那么实际等于建了(a),(a,b),(a,b,c)三个索引,因为每多一个索引,都会增加写操作的开销和磁盘空间的开销。对于大量数据的表,这可是不小的开销!
  2. 覆盖索引。同样的有复合索引(a,b,c),如果有如下的sql: select a,b,c from table where a=1 and b = 1。那么MySQL可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io操作。减少io操作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一
  3. 索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select * from table where a = 1 and b =2 and c = 3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出1000W*10%=100w 条数据,然后再回表从100w条数据中找到符合b=2 and c= 3的数据,然后再排序,再分页;如果是复合索引,通过索引筛选出1000w *10% *10% *10%=1w,然后再排序、分页,哪个更高效,一眼便知

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值