MySQL-3、索引

前言

在上一篇文章中,介绍了数据页,我们知道各个数据页可以组成一个双向链表,而每个数据页中

的记录(也就是真实数据),会按照主键升序组成一个单向链表。在数据页中查找指定数据,是根

据槽+二分法。正常情况,MySQL存储的数据会很多,相应的数据页就会有很多。那如何找到符合

数据的数据页呢,一个一个遍历?那肯定是不可能的,这就用到了我们经常说的索引了。

(如果没有看前面两篇文章,不建议看此篇文章)

传送门:

MySQL-1、InnoDB行格式

MySQL-2、InnoDB数据页

一、一个简易的索引方案

假如一张表t_demo,有三个字段,id主键并且自增长,c1列,c2列两个均为varchar。

同时添加九条数据,如下图所示。

上面是页号,下面是真实的数据,最上一排是record_type,再粘过来回忆一下,0 普通记录、1

B+树非叶子节点的目录项记录、2 表示Infimum记录、3 Supremum记录。

绿色的是next_record,下一条记录的指针。蓝色是真实的数据。

这样排列主要是一个页面画不了太多,也方便理解,这里的数据页都会包含Page Header、

Page Directory等。(:大家看到数据页中的页号不是连续的,这个是正常的,会在后续的表空

间再介绍)

假如现在要查询主键为5的数据。

这些大小为16KB的页在磁盘上可能不是挨着的,如果想从这么多页中根据条件定位某些记录所在

的页,就需要编制一个目录(没有是套一层 解决不了的)。

如下所示:

目录中,存储 页号以及数据页中最小的主键值。

那么如何查询主键为5的数据呢,很简单,先根据目录找到主键为5所在的目录,然后再根据上一篇

文章数据页中查找记录的方法。

这个目录还有个别名,叫做 “索引”。

二、InnoDB索引

 InnoDB的索引,就是将上面的“目录”,放入到数据页中。与上篇的数据页结构有的都有。最大的

区别在于,User Records存放的记录是不一样。

那么如何区分是普通数据记录还是目录中的记录呢,这就用到了之前行格式中的record_type了。0

就是普通记录、1是B+树非叶子节点的目录项记录。(InnoDB的索引是用B+树结构,不知道B+树

的后面再详细介绍,现在知道B+树是一种数据结构就行)

InnoDB索引结构如下图:

再强调一下目录项记录和普通用户记录的不同点(此处说的目录项记录是B+树中的非

叶子节点

1、目录项记录的record_type是1,普通用户记录的record_type是0。

2、目录项记录存放的的数据,根据索引类型,存放的数据是不一样的。聚簇索引存放的是,主键

值和页号,非聚簇索引存放的是,索引列、主键值和页号。普通用户记录是用户自定义的列,还包

含隐藏列。

再插入一些数据,数据页满足16KB之后,会再新增数据页。如下所示

那假如再新增非常的数据,则会产生很多存储目录项记录的页,那么我们怎么根据主键值快速定位

一个存储目录项记录的页呢?其实也很简单,为这些目录项记录的页生成一个更高级的目录。

如下图所示:

上面这张图,倒过来看像不像一颗树呢 ,最上面是树根,下面是树叶。这其实是一种组织数据的

形式,或者说是一种数据结构,它的名称就是”B+树“。

无论是存放用户记录的数据页,还是存放目录项记录的数据页,InnoDB都把它们存放到B+树这个

结构中,这些数据页也称为B+树节点。我们真正的用户记录存放在+树最底层的节点上,这些节点

也称为”叶子节点或者页节点“。其余用来存放目录项记录的节点称为”非叶子节点或者内节点“。

其中B+树最上层的节点也称为”根节点“。

:叶子节点中存储的数据和真实存放的数据是一个东西)

从图中也可以看出,B+树可以分好多层,其中InnoDB规定最下面一层,也就是存放用户记录的那

层,我们叫做”第0层“,大家可能也听过,MySQL中B+树最好不要超过3层,因为每多一层,就会

多一次磁盘I/O,二磁盘I/O是很消耗性能的。

大家还记得Page Header中有个属性,叫做page_level,表示当前页在B+树中所处的层级

下面介绍几种索引类型。

聚簇索引

聚簇索引是一种特殊类型的索引,它与其他索引类型(如非聚簇索引)不同,因为它实际上是将数

据行存储在索引的叶子节点上。(聚簇索引的一个特性,它直接将数据行存储在索引的叶子节点

。)

当在表上创建一个主键时,MySQL 会自动为该主键创建一个聚簇索引。这意味着主键列的值会

按照顺序存储在磁盘上,并且可以通过该索引快速访问特定行。

聚簇索引的存储方式(所有用户记录都存储在叶子节点上),也就是常说的“索引即数据,数据即

索引

二级索引

聚簇索引只能在搜索条件是主键值才能发挥作用。那么如果我想根据其他列作为搜索条件咋办?

即再建一个B+树(每个索引就是一个B+树),当为表中另一个字段,创建索引,会发生什么。

如下图所示

二级索引中的数据页记录是根据索引列的大小顺序排列的,二级索引也叫 辅助索引

二级索引与聚簇索引有几处不同

1、二级索引的B+树叶子节点,存放的不是完整的数据,而是索引列+主键。

2、二级索引的B+树非叶子节点,存放的是索引列+主键+页号。

那么如何根据二级索引进行查询呢

1、先根据二分法找到索引列的页号。

2、找到二级索引的叶子节点中的主键值。

3、根据主键值,再到聚簇索引,查询除了索引列的数据。

(这个就叫做回表:携带主键信息,再到聚簇索引中重新定位完整的用户记录的过程。)

4、重复上述三个步骤,直到下条记录不满足索引列的筛选条件。(因为根据索引列顺序排放的)

大家可能都有一个疑问,索引是数字挺好理解,但如果是字符串呢,如何顺序排放,其实是一样

的,因为字符串根据编码规则,也是可以比大小的,只是相对麻烦些

联合索引

我们也可以同时以多个列的大小作为排序规则,也就是同时为多个列建立索引,这种我们叫做

联合索引”,页称为‘复合索引或多列索引“,他本质上也是一个二级索引。

那我们建立联合索引,它的B+树是什么样的呢?

联合索引相对于单个列创建的索引,有以下不同

1、假如创建联合索引为c1和c2列,那么该B+树中的数据页会先根据c1列进行排序,然后再根据

c2列进行排序。如果再有列,依次排序。最后再根据主键值排序。

2、联合索引的B+树叶子节点,存放的不是完整的数据,而是索引列+主键(c1列+c2列+主键)。

3、联合索引的B+树非叶子节点,存放的是索引列+页号(c1列+c2列+主键+页号)。

为什么二级索引的非叶子节点要存储主键?

因为二级索引的列会存在重复值,如果页5和页6中都有二级索引列相同的值,那么新插入一条相同

列的数据,要插入页5还是页6呢?所以为了新插入的记录能够找到自己属于哪个页,就需要保证

B+树同一层非叶子节点(内节点)的目录项记录除了页号之外是唯一的

三、InnoDB中B+树索引生成过程

前面为了介绍B+树索引的时候,直接就把所有内节点和根节点都画出来了。实际上B+树的形成过

程大致是如下:

1、每当为一个表创建一个索引时,都会为这个索引创建一个根节点页面(聚簇索引不是人为创造

的,它默认就存在)。最开始表中没有数据,每个B+树对应的根节点既没有用户记录也没有目录

项记录。

2、随后插入用户记录时,先把用户记录存储到根节点中。

3、根节点的可用空间用完后,再次插入用户记录,此时会把根节点的所有用户记录复制到一个新

分配的页中,比如页66,然后再对这个新页进行页分裂,得到一个新页,比如页67。

4、这是再插入一条用户记录,该记录会分配到页66或页67中。根节点此时升级为存储目录项记录

的数据页,这就需要把页66和页67对应的目录项记录插入到根节点中。

注:一个B+树索引的根节点自创建之日起便不会再移动(页号不会再改变)。根节点的页号会存

储到某个地方,后续InnoDB存储引擎用到这个索引时,会从固定地方取出页号,从而访问这个索

  • 18
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
索引是一种数据结构,它可以帮助加快数据库表中数据的检索速度。在 MySQL 数据库中,索引通常被称为 B-tree 索引,它可以加速 SELECT、UPDATE 和 DELETE 操作的速度。在本文中,我们将介绍 MySQL 中的索引,包括索引的类型、如何创建索引、如何使用索引以及索引的优化。 ## 索引的类型 MySQL 支持多种类型的索引,包括以下几种常见的类型: - PRIMARY KEY 索引:用于唯一标识数据库表中的每一行记录。 - UNIQUE 索引:用于确保表中某一列的值是唯一的。 - INDEX 索引:用于加速表中的数据检索操作。 - FULLTEXT 索引:用于全文搜索操作。 ## 如何创建索引MySQL 中,可以使用 CREATE INDEX 语句来创建索引。例如,下面的语句创建一个名为 idx_last_name 的索引,用于加速对 employees 表中 last_name 列的检索: ``` CREATE INDEX idx_last_name ON employees (last_name); ``` 需要注意的是,创建索引可能会增加数据库表的插入、更新和删除操作的时间开销。因此,应该谨慎地考虑是否需要创建索引,以及应该创建哪些索引。 ## 如何使用索引MySQL 中,可以使用 EXPLAIN 语句来查看查询语句的执行计划。如果查询语句使用了索引,则在执行计划中会显示使用的索引名称。例如,下面的语句使用 EXPLAIN 来查看对 employees 表进行 last_name 列检索的执行计划: ``` EXPLAIN SELECT * FROM employees WHERE last_name = 'Smith'; ``` 如果查询语句没有使用索引,则可以使用 FORCE INDEX 语句来强制使用指定的索引。例如,下面的语句强制使用 idx_last_name 索引来对 employees 表进行 last_name 列检索: ``` SELECT * FROM employees FORCE INDEX (idx_last_name) WHERE last_name = 'Smith'; ``` 需要注意的是,强制使用索引可能会导致性能下降。因此,应该仅在必要时使用强制索引。 ## 索引的优化 在 MySQL 中,可以使用 OPTIMIZE TABLE 语句来优化数据库表。优化表可以帮助减少表中的碎片,提高表的查询性能。例如,下面的语句优化 employees 表: ``` OPTIMIZE TABLE employees; ``` 此外,还可以使用 ANALYZE TABLE 语句来分析表中的数据分布情况,以便优化索引。例如,下面的语句分析 employees 表的数据分布情况: ``` ANALYZE TABLE employees; ``` 需要注意的是,索引的性能可能会受到数据分布的影响。如果表中的数据分布不均匀,则可能需要重新设计索引或优化查询语句以提高性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值