深入浅出索引（下）

最新推荐文章于 2024-09-24 12:13:06 发布

2NaCl

最新推荐文章于 2024-09-24 12:13:06 发布

阅读量126

点赞数 1

分类专栏： Mysql 文章标签：索引

本文链接：https://blog.csdn.net/qq_41936805/article/details/97176458

版权

Mysql 专栏收录该内容

11 篇文章 1 订阅

订阅专栏

上一专栏我们主要讲了索引不同的种类和对应的原理方法，优缺点这样的特性，并且还知道了主键索引和非主键索引的区别，应用场景等一系列的话题让我们了解了索引，接下来，将会更加深入的了解索引。
在这里插入图片描述

在上面这个表中，如果执行select * from T where k between 3 and 5,需要执行几次树的搜索操作，会扫描多少行？

现在可以一起来看看这条sql查询语句的执行流程：

在k索引树上找到k=3的记录，取得ID=300；
再到ID索引树查到ID=300对应的R3；
在k索引树取下一个值k=5，取得ID=500；
再回到ID索引树查到ID=500对应的R4；
在k索引树取下一个值k=6，不满足条件，循环结束。

在整个过程中，回到主键索引树搜索的过程，称之为回表，这个查询过程读了k索引树的3条记录(步骤1 3 5)，回表了两次(步骤2 4)

由于查询结果所需要的数据只在主键索引上有，所以不得不回表。

覆盖索引

如果执行的语句是select ID from T where k between 3 and 5，这时候只需要查ID的值，而Id的值已经在k索引树上，因此可以直接提供查询结果，不需要回表。在这个查询中，索引k已经覆盖了我们的查询需求，所以称之为覆盖索引。

由于覆盖索引是一个常用的性能优化手段，所以确实可以显著提升查询性能，所以使用覆盖索引是一个常用的性能优化手段。

那么，在一个市民信息表上，是否有必要将身份证号和名字建立联合索引？

假设市民表是这样的：

mysql> create table tuser(
 id int (11) not null, 
 id_card varchar(32) default null, 
 name varchar(32) default null, 
 age int(11) default null, 
 ismale tinyint(1) default null, 
 primary key (id), key id_card(id_card), 
 key name_age (name,age) 
 )ENGINE = InnoDB;                      
Query OK, 0 rows affected (0.04 sec)

在这里插入图片描述
我们只知道身份证号是市民的唯一标识。如果有根据身份证号查询市民信息的需求，我们只要在身份证号字段上建立索引就够了。再建立一个索引会不会浪费时间？

假如有一个高频请求，要根据市民的身份证号查询他的姓名，这个联合索引就有意义了。因为可以在高频请求上用到覆盖索引，不需要查询整行记录，减少语句的执行。

最左前缀原则

如果为每一种查询都设计一种索引，是不是索引太多了。如果要按照市民的身份证号去查询家庭地址呢？虽然这个查询在业务找那个出现的不多，但是也不能全表扫描，那么应该怎么做呢？

答：使用B+树索引结构，来定位记录。

在这里插入图片描述

可以看到，当查询张三的时候，会快速定位到ID4，然后得到结果。

如果要查询张xx，那么就是where name like ‘张%’。这时候，也能用上这个索引，从ID3开始向后遍历。

可以看到，不只是索引的全部定义，只要满足最左前缀，就可以利用索引来加速检索。这个最左前缀可以是联合索引的最左n个字段，也可以是字符串索引的最左m个字符。

那么问题就来了，
如何在建立联合索引的时候，安排索引内的字段顺序。

我们可以用索引的复用能力来评估。因为可以支持最左前缀，所以当有了(a,b)这个联合索引之后，一般就不需要单独在a上建立索引了。因此，第一原则是，如果通过调整顺序，可以少维护一个索引，那么这个顺序往往就是需要优先考虑的。

那么，如果既有联合查询，又有基于a、b各自的查询呢？

查询条件里只有b的语句，是无法使用(a,b)这个联合索引的，这时候就不得不维护另外一个索引，也就是说你需要同时维护(a,b)(b)这两个索引。

这时候就要考虑的是空间了。比如上面这个市民表，name字段就是比age字段大的，所以就应该创建一个(name,age)的联合索引和一个(age)的单字段索引。

索引下推

上面提到了最左前缀原则，最左前缀原则可以在索引中定位记录。这时，你可能要问，不符合最左前缀的部分，会怎么样呢？

我们还是以市民表的联合索引(name,age)为例，如果现在有这样一个需求，找出名字第一个字是张，而且年龄是10岁的所有男孩。那么sql语句该这样写：

mysql>select * from tuser where name like '张%' and age = 10 and ismale = 1;

过程是先筛选出来张%这个条件，然后找到满足条件的ID3,。

在mysql 5.6之前，只能从ID3开始一个个回表，到主键索引上找出数据行，在对比字段。

在mysql 5.6之后，引入的素银下推优化，可以在索引遍历的时候，对包含字段判断，过滤不满足要求的记录，减少回表次数。

以下为执行图：

mysql 5.6之前
在这里插入图片描述

mysql 5.6之后

在这里插入图片描述

索引回表次数得到更新，性能提高，成本降低了。

2NaCl

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录