MySQL的索引结构

@从入门到入土

于 2018-12-11 23:39:33 发布

阅读量2.2k

点赞数 6

分类专栏： MySQL 文章标签： MySQL 索引 B+Tree

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011212394/article/details/84962775

版权

MySQL 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

目录

索引是什么？

索引的作用

为什么索引的数据结构使用B+Tree？

平衡二叉查找树 AVL-Tree

多路平衡查找树 B-Tree

多路平衡查找树加强版 B+Tree

B+Tree的优势

MySQL中B+Tree的表现形式

MyISAM引擎（非聚簇索引）

InnoDB引擎（聚簇索引 + 非聚簇索引）

最左前缀原则

索引是什么？

索引是对数据库表中一列或多列的值进行排序的一种结构，使用索引可快速访问数据库表中的特定信息。

索引的作用

索引能极大的减少存储引擎需要扫描的数据量。

索引可以把随机IO变成顺序IO。

索引可以帮助我们在进行分组、排序等操作时，避免使用临时表。

为什么索引的数据结构使用B+Tree？

平衡二叉查找树 AVL-Tree

缺点：

太高：树的高（深）度决定着它的IO操作次数。显然，当数据量逐渐增加时，平衡二叉树的深度也会显著增加。

太小：每一个节点保存的数据量太小了。没有很好的利用操作磁盘IO的数据交换特性，也没有利用好磁盘IO的预读能力（空间局部性原理），从而带来频繁的IO操作。

多路平衡查找树 B-Tree

查询的效率取决于与磁盘IO的次数，减少磁盘IO的次数就必须要压缩树的高度，B-Tree 很好的解决了平衡二叉树的小与高的问题，让瘦高的树尽量变成矮胖的树。

多路平衡查找树加强版 B+Tree

B+Tree的优势

磁盘读写能力强。B+Tree非叶节点不保存数据相关信息，只保存关键字和子节点的引用，所以一个节点可以保存更多关键字，一次磁盘加载的关键字更多。
扫表能力更强。B+Tree关键字对应的数据都保存在叶子节点上，进行全表扫描时，只需要遍历叶子节点，无需遍历整棵树。
遍历、排序、范围搜索的能力更强。B+Tree叶子节点是顺序排列的，并且相邻节点具有顺序引用的关系，所以对于这种依赖顺序或范围的操作更有优势。
检索效率更加稳定。B+Tree 永远是在叶子节点拿到数据，所以 IO 次数是稳定的。

MySQL中B+Tree的表现形式

MyISAM引擎（非聚簇索引）

MyISAM的索引都属于B+Tree结构的非聚簇索引，索引与数据是分开的，B+Tree的叶子节点上存放的是数据的地址。主键索引和辅助索引没有区别，只是主键索引必须是唯一的。

InnoDB引擎（聚簇索引 + 非聚簇索引）

InnoDB的主键是B+Tree结构的聚簇索引，将主键组织到一棵B+Tree中，而行数据就储存在叶子节点上。聚簇索引是按大小排列的，因此对于范围查询的效率很高。

InnoDB中除了主键索引其他辅助索引都是非聚簇索引，叶子节点则存储的是主键的值，所以通过辅助索引查询其实需要两个过程，先确定数据的主键，再通过主键进行查询。

联合索引

由多个列组成的索引称为联合索引。

善于利用联合索引有以下好处：

减少开销：建一个联合索引(a,b,c)，实际相当于建了(a),(a,b),(a,b,c)三个索引。每多一个索引，都会增加写操作的开销和磁盘空间的开销。对于大量数据的表，使用联合索引会大大的节省开销。

覆盖索引：对联合索引(a,b,c)，如果有如下的sql: select a,b,c from test where a=1 and b=2；那么MySQL可以直接通过遍历索引取得数据，而无需回表，这减少了很多的随机io操作，提升性能。

效率高：索引列越多（不超过5个），通过索引筛选出的数据越少，减少回表次数。

最左前缀原则

对索引中关键字进行匹配时，一定是从左往右依次进行，不能跳过。如果最左边是模糊的，那么将无法命中索引。

例如对于单列索引：a like'%123'；联合索引 (a,b,c)：where b=2 and c=3; 都无法命中索引。

理解了索引结构 B+Tree 的特点之后，就不难理解最左前缀原则了。

覆盖索引

如果一本书需要知道第 11 章是什么标题，会翻开第 11 章对应的那一页吗？目录浏览一下就好，这个目录就是起到覆盖索引的作用。

能够建立索引的种类分为主键索引、唯一索引、普通索引三种，而覆盖索引只是一种查询的一种效果，用 explain 的结果，extra 列会出现：using index。

例如我们有 (a,b,c) 三列组成的联合索引：

SELECT c FROM TABLE WHERE a = 'aaa' AND b = 'bbbb';

这样就用到了覆盖索引。

覆盖索引可减少数据库IO，将随机IO变为顺序IO，可提高查询性能。

@从入门到入土

关注

6
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

@从入门到入土 CSDN认证博客专家 CSDN认证企业博客

码龄11年

194: 原创

3万+: 周排名

171万+: 总排名

60万+: 访问

: 等级

6796: 积分

788: 粉丝

348: 获赞

70: 评论

867: 收藏

私信

关注

热门文章

分类专栏

最新评论

微信朋友圈设计原理
@从入门到入土: 用户线肯定是独立的，数据库压力大可以基于用户维度横向扩展，分库分表或者换分布式存储
微信朋友圈设计原理
开发者-钟大田: 每个用户都有一个用户线是不是对于数据库来说特别大压力。还是全部的用户有一个用户线？
ThreadLocal使用场景与原理
Yukino_Saori: ThreadLocal在ThreadLocalMap中不应该是key吗
微信朋友圈设计原理
@从入门到入土: 新加好友的动作会更新你的时间线，等你再刷朋友圈的时候就能看见新好友的朋友圈了
微信朋友圈设计原理
faded-: 如果新加了好友，怎么在我的时间线里看到新好友的朋友圈？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

@从入门到入土 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。