MySQL-3、索引

杨文同学

已于 2024-05-26 21:12:32 修改

阅读量1k

点赞数 18

分类专栏： MySQL 文章标签： mysql

于 2024-04-25 20:54:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40950398/article/details/138199412

版权

MySQL 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

前言

在上一篇文章中，介绍了数据页，我们知道各个数据页可以组成一个双向链表，而每个数据页中

的记录（也就是真实数据），会按照主键升序组成一个单向链表。在数据页中查找指定数据，是根

据槽+二分法。正常情况，MySQL存储的数据会很多，相应的数据页就会有很多。那如何找到符合

数据的数据页呢，一个一个遍历？那肯定是不可能的，这就用到了我们经常说的索引了。

（如果没有看前面两篇文章，不建议看此篇文章）

传送门：

MySQL-1、InnoDB行格式

MySQL-2、InnoDB数据页

一、一个简易的索引方案

假如一张表t_demo，有三个字段，id主键并且自增长，c1列，c2列两个均为varchar。

同时添加九条数据，如下图所示。

上面是页号，下面是真实的数据，最上一排是record_type，再粘过来回忆一下，0 普通记录、1

B+树非叶子节点的目录项记录、2 表示Infimum记录、3 Supremum记录。

绿色的是next_record，下一条记录的指针。蓝色是真实的数据。

这样排列主要是一个页面画不了太多，也方便理解，这里的数据页都会包含Page Header、

Page Directory等。（注：大家看到数据页中的页号不是连续的，这个是正常的，会在后续的表空

间再介绍）

假如现在要查询主键为5的数据。

这些大小为16KB的页在磁盘上可能不是挨着的，如果想从这么多页中根据条件定位某些记录所在

的页，就需要编制一个目录（没有是套一层解决不了的）。

如下所示：

目录中，存储页号以及数据页中最小的主键值。

那么如何查询主键为5的数据呢，很简单，先根据目录找到主键为5所在的目录，然后再根据上一篇

文章数据页中查找记录的方法。

这个目录还有个别名，叫做 “索引”。

二、InnoDB索引

InnoDB的索引，就是将上面的“目录”，放入到数据页中。与上篇的数据页结构有的都有。最大的

区别在于，User Records存放的记录是不一样。

那么如何区分是普通数据记录还是目录中的记录呢，这就用到了之前行格式中的record_type了。0

就是普通记录、1是B+树非叶子节点的目录项记录。（InnoDB的索引是用B+树结构，不知道B+树

的后面再详细介绍，现在知道B+树是一种数据结构就行）

InnoDB索引结构如下图：

再强调一下目录项记录和普通用户记录的不同点（此处说的目录项记录是B+树中的非

叶子节点）

1、目录项记录的record_type是1，普通用户记录的record_type是0。

2、目录项记录存放的的数据，根据索引类型，存放的数据是不一样的。聚簇索引存放的是，主键

值和页号，非聚簇索引存放的是，索引列、主键值和页号。普通用户记录是用户自定义的列，还包

含隐藏列。

再插入一些数据，数据页满足16KB之后，会再新增数据页。如下所示

那假如再新增非常的数据，则会产生很多存储目录项记录的页，那么我们怎么根据主键值快速定位

一个存储目录项记录的页呢？其实也很简单，为这些目录项记录的页生成一个更高级的目录。

如下图所示：

上面这张图，倒过来看像不像一颗树呢，最上面是树根，下面是树叶。这其实是一种组织数据的

形式，或者说是一种数据结构，它的名称就是”B+树“。

无论是存放用户记录的数据页，还是存放目录项记录的数据页，InnoDB都把它们存放到B+树这个

结构中，这些数据页也称为B+树节点。我们真正的用户记录存放在+树最底层的节点上，这些节点

也称为”叶子节点或者页节点“。其余用来存放目录项记录的节点称为”非叶子节点或者内节点“。

其中B+树最上层的节点也称为”根节点“。

（注：叶子节点中存储的数据和真实存放的数据是一个东西）

从图中也可以看出，B+树可以分好多层，其中InnoDB规定最下面一层，也就是存放用户记录的那

层，我们叫做”第0层“，大家可能也听过，MySQL中B+树最好不要超过3层，因为每多一层，就会

多一次磁盘I/O，二磁盘I/O是很消耗性能的。

（大家还记得Page Header中有个属性，叫做page_level，表示当前页在B+树中所处的层级）

下面介绍几种索引类型。

聚簇索引

聚簇索引是一种特殊类型的索引，它与其他索引类型（如非聚簇索引）不同，因为它实际上是将数

据行存储在索引的叶子节点上。（聚簇索引的一个特性，它直接将数据行存储在索引的叶子节点

中。）

当在表上创建一个主键时，MySQL 会自动为该主键创建一个聚簇索引。这意味着主键列的值会

按照顺序存储在磁盘上，并且可以通过该索引快速访问特定行。

聚簇索引的存储方式（所有用户记录都存储在叶子节点上），也就是常说的“索引即数据，数据即

索引”

二级索引

聚簇索引只能在搜索条件是主键值才能发挥作用。那么如果我想根据其他列作为搜索条件咋办？

即再建一个B+树（每个索引就是一个B+树），当为表中另一个字段，创建索引，会发生什么。

如下图所示

二级索引中的数据页记录是根据索引列的大小顺序排列的，二级索引也叫 辅助索引。

二级索引与聚簇索引有几处不同

1、二级索引的B+树叶子节点，存放的不是完整的数据，而是索引列+主键。

2、二级索引的B+树非叶子节点，存放的是索引列+主键+页号。

那么如何根据二级索引进行查询呢

1、先根据二分法找到索引列的页号。

2、找到二级索引的叶子节点中的主键值。

3、根据主键值，再到聚簇索引，查询除了索引列的数据。

(这个就叫做回表：携带主键信息，再到聚簇索引中重新定位完整的用户记录的过程。)

4、重复上述三个步骤，直到下条记录不满足索引列的筛选条件。（因为根据索引列顺序排放的）

（大家可能都有一个疑问，索引是数字挺好理解，但如果是字符串呢，如何顺序排放，其实是一样

的，因为字符串根据编码规则，也是可以比大小的，只是相对麻烦些）

联合索引

我们也可以同时以多个列的大小作为排序规则，也就是同时为多个列建立索引，这种我们叫做

“联合索引”，页称为‘复合索引或多列索引“，他本质上也是一个二级索引。

那我们建立联合索引，它的B+树是什么样的呢？

联合索引相对于单个列创建的索引，有以下不同

1、假如创建联合索引为c1和c2列，那么该B+树中的数据页会先根据c1列进行排序，然后再根据

c2列进行排序。如果再有列，依次排序。最后再根据主键值排序。

2、联合索引的B+树叶子节点，存放的不是完整的数据，而是索引列+主键（c1列+c2列+主键）。

3、联合索引的B+树非叶子节点，存放的是索引列+页号（c1列+c2列+主键+页号）。

为什么二级索引的非叶子节点要存储主键？

因为二级索引的列会存在重复值，如果页5和页6中都有二级索引列相同的值，那么新插入一条相同

列的数据，要插入页5还是页6呢？所以为了新插入的记录能够找到自己属于哪个页，就需要保证

B+树同一层非叶子节点(内节点)的目录项记录除了页号之外是唯一的。

三、InnoDB中B+树索引生成过程

前面为了介绍B+树索引的时候，直接就把所有内节点和根节点都画出来了。实际上B+树的形成过

程大致是如下：

1、每当为一个表创建一个索引时，都会为这个索引创建一个根节点页面（聚簇索引不是人为创造

的，它默认就存在）。最开始表中没有数据，每个B+树对应的根节点既没有用户记录也没有目录

项记录。

2、随后插入用户记录时，先把用户记录存储到根节点中。

3、根节点的可用空间用完后，再次插入用户记录，此时会把根节点的所有用户记录复制到一个新

分配的页中，比如页66，然后再对这个新页进行页分裂，得到一个新页，比如页67。

4、这是再插入一条用户记录，该记录会分配到页66或页67中。根节点此时升级为存储目录项记录

的数据页，这就需要把页66和页67对应的目录项记录插入到根节点中。

注：一个B+树索引的根节点自创建之日起便不会再移动（页号不会再改变）。根节点的页号会存

储到某个地方，后续InnoDB存储引擎用到这个索引时，会从固定地方取出页号，从而访问这个索

引。

关注

18
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
MySQL-3、索引

例如：以上就是今天要讲的内容，本文仅仅简单介绍了pandas的使用，而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
复制链接

扫一扫

专栏目录

杨文同学 CSDN认证博客专家 CSDN认证企业博客

码龄7年

14: 原创

87万+: 周排名

7万+: 总排名

8614: 访问

: 等级

340: 积分

148: 粉丝

191: 获赞

0: 评论

198: 收藏

私信

关注

热门文章

分类专栏

最新评论

行为型模式--责任链模式
CSDN-Ada助手: 恭喜用户写了第三篇博客，题为“行为型模式--责任链模式”！继续创作是非常了不起的事情，希望你能够保持这种创作热情和态度。接下来，建议你可以尝试深入研究其他行为型模式，比如观察者模式或策略模式等，这样可以让你的知识更加全面和深入。加油！期待你的更多精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。