说说为什么用了索引之后，查询就会变快？

u011277123

于 2020-03-11 14:58:00 发布

阅读量1.3k

点赞数

原文链接：https://mp.weixin.qq.com/s/WpbwJRqFVjBtd4luckUotA

版权

牛旦教育IT课堂 2020-01-20 08:16:00

作者：会点代码的大叔

链接：https://mp.weixin.qq.com/s/WpbwJRqFVjBtd4luckUotA

都知道索引有助于快速检索，但为什么用了索引之后，查询就会变快？

相信很多程序员朋友对数据的索引并不陌生，最常见的索引是 B+ Tree 索引，索引可以加快数据库的检索速度，但是会降低新增、修改、删除操作的速度，一些错误的写法会导致索引失效等等。

但是如果被问到，为什么用了索引之后，查询就会变快？B+ Tree 索引的原理是什么？这时候很多人可能就不知道了，今天我就以 MySQL 的 InnoDB 引擎为例，讲一讲 B+ Tree 索引的原理。

索引的基础知识

MySQL 的基本存储结构是页，大概就是这个样子的：

说说为什么用了索引之后，查询就会变快？

在这里，我们需要了解以下几点（非常重要）：

当我们用 MySQL 的 InnoDB 引擎创建表，有且只能有一个主键；如果我们没有显示地指定，那么MySQL 会自动生成一个隐含字段作为主键；
聚集索引：以主键创建的索引；聚集索引的叶子节点存储的是表中的数据；
非聚集索引：非主键创建的索引；非聚集索引在叶子节点存储的是主键和索引列；使用非聚集索引查询数据，会查询到叶子上的主键，再根据主键查到数据（这个过程叫做回表）。

页和页之间、页和数据之间的关系

我们以聚集索引做讲解，页和页之间、以及页和数据之间的关系是这样的：

说说为什么用了索引之后，查询就会变快？

数据页和数据页之间，组成一个双向链表；
每个数据页中的记录，是一个单向链表；
每个数据页都根据内部的记录生成一个页目录（Page directory），如果是主键的话，可以在页目录中使用二分法快速定位；
如果我们根据一个非主键、非索引列进行查询，那么需要遍历双向链表，找到所在的页；再遍历页内的单向链表；如果表内数据很大的话，这样的查询就会很慢。

B+ Tree 索引的原理

先让我们看看 B+ Tree 索引大概是什么样子（以聚集/主键索引为例）：

说说为什么用了索引之后，查询就会变快？

假如这时候我们要查询 id = 16 的数据：
查询页-1，找到页-2 存储的是小于 30 的数据；
查询页-2，找到页-5 存储的是 10~20 的数据；
查询页-5，找到 id = 16 的数据。

很显然，

如果我们根据一个非主键、非索引列进行查询，那么需要遍历双向链表，找到所在的页；再遍历页内的单向链表；如果表内数据很大的话，这样的查询就会很慢。所以没有用索引的时候，需要遍历双向链表来定位对应的页，而有了索引，则可以通过一层层“目录”定位到对应的页上。

为什么 B+ Tree 索引会降低新增、修改、删除的速度

B+ Tree 是一颗平衡树，如果对这颗树新增、修改、删除的话，会破坏它的原有结构；
我们在做数据新增、修改、删除的时候，需要花额外的时间去维护索引；
正因为这些额外的开销，导致索引会降低新增、修改、删除的速度。

现在你是否理解了 B+ Tree 索引的原理？

最后再留一个思考题：为什么官方建议使用自增长主键作为索引？大家可以在留言中写下你的答案。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。