深入理解MySql索引底层数据结构与算法

最新推荐文章于 2024-07-16 13:12:23 发布

hustfc

最新推荐文章于 2024-07-16 13:12:23 发布

阅读量354

点赞数 1

分类专栏：数据结构

本文链接：https://blog.csdn.net/weixin_36372879/article/details/90668838

版权

数据结构专栏收录该内容

9 篇文章 0 订阅

订阅专栏

索引是排序号的数据结构
索引是用来优化数据库查询速度的，是表级别的。
mysql会根据主键来自动建立索引方便查询。
下面介绍索引的底层原理以及很多细节的步骤。

1. 为什么使用B+树而不使用二叉搜索树或者红黑树

二叉搜索树：
在这里插入图片描述
红黑树：

B树：

首先二叉搜索树是不能够自己调整高度的。
红黑树能够自己调整高度，用在java的HashMap中，但是红黑树也是二叉树，建立索引之后的高度仍然太高。
而B-树和B+树每一层能够存储更多的节点。

2. B树和B+树的区别

B树：
在这里插入图片描述
B+树：

B树和B+树主要有两点区别：

B+树的非叶子节点不存储data，，只存储key这样，可以增大长度。因为cpu读取磁盘到内存中的时候，是按照页来进行读取的，一页为4K，一般最多也就读取三四页的样子，因此不存储data可以多读取索引值，减少I/O次数，加快查询。
B+树叶子节点有顺序访问指针，可以加快访问的性能，主要可以加快范围查找的性能，比如查找age>20的，就可以通过指针直接查找，如果使用B树，还要返回到上一层来查找

3. 两种索引原理(MyISAM和InnoDb)

两者都是表级别的索引，在建立表的时候，可以自行选择。

区别一：聚集索引和非聚集索引

MyISAM是非聚集的，也就是说索引文件和数据文件是分离的。
在这里插入图片描述
在MyISAMB+树中，key是主键，value是数据存放的磁盘地址，根据主键查找地址，然后再根据地址来查找数据。

但是在InnoDb中，是聚集索引，也就是说叶子节点的value是完整的数据记录，根据key可以直接查找到所有的数据。
在这里插入图片描述

区别二：非主键索引

MyISAM在查找非主键的时候，与主键一样建立索引：
在这里插入图片描述

InnoDb不一样。非主键索引的叶子节点存储的是主键的值
因为这样可以保证数据的一致性和节省存储空间
在这里插入图片描述

区别三：存储文件

MyISAM表在磁盘上有三个文件：
在这里插入图片描述
frm是表数据结构，MYD是表数据，MYI是表索引。
也就是MyISAM根据表索引MYI来查找表数据MYD

而InnoDB只有两个存储文件，idb文件存储的是索引+数据
在这里插入图片描述

4. 一次I/O读取页的大小

通过这个查询sql可以看到B+树的页大小
在这里插入图片描述

可以看到结果为16K，16K个字节
为什么mysql页文件默认16KB？
假设一行数据大小为1K，那么一页能够存16条数据，也就是一个叶子节点能够存16条数据
假设主键ID为byte类型，那么长度为8B(字节)，指针大小在InnoDb与源码中为6B，因此一共14B，那么一页可以存：
16K/14=1170个(主键+指针)
那么一颗高度为2的B+树能够存储的数据为：1170x16=18720条，
一颗高度为3的B+树能够存储数据为：1170x1170x16=21902400(千万级)
在这里插入图片描述

这也显示了为什么用B+树而不使用B树的原因：
B+树的数据是不存储在非叶子节点上的，这也非叶子节点可以存放更多的索引数据，使得树的高度更小，优化了查询速度，同时B+树还有范围查询快，数据查询开销平均等优点。

B+树的高度一般也就5行一下，也就是几次磁盘I/O就能够查询出。

4. InnoDB为什么必须有索引

InnoDB表必须有主键，并且推荐使用整型的自增主键。如果自己不建立主键，InnoDB会自己选择一个默认的列做索引。

5. 自增整型和uuid作为主键的选择

整型的索引占8个字节，uuid占的字节数更多，因此不推荐使用uuid作为主键索引。
另外uuid不合适进行比较，uuid需要先转换为ASCII码
因此加快查询速度可以使用整型索引，优点很多。
另外为什么选择自增？
如果插入了小于之前索引的元素，可能会造成分裂。这样会降低性能。

6. 联合索引

B+树的联合索引的底层存储结构长什么样？
在这里插入图片描述

hustfc

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深入理解MySql索引底层数据结构与算法

索引是用来优化数据库查询速度的，是表级别的。mysql会根据主键来自动建立索引方便查询。下面介绍索引的底层原理以及很多细节的步骤。1. 为什么使用B+树而不使用二叉搜索树或者红黑树二叉搜索树：红黑树：B树：首先二叉搜索树是不能够自己调整高度的。红黑树能够自己调整高度，用在java的HashMap中，但是红黑树也是二叉树，建立索引之后的高度仍然太高。而B-树和B+树每一层能够...
复制链接

扫一扫

专栏目录