索引的本质、红黑树、b-树、b+树、myisam存储引擎、innodb存储引擎

最新推荐文章于 2023-11-26 04:10:45 发布

sp_wxf

最新推荐文章于 2023-11-26 04:10:45 发布

阅读量359

点赞数

本文链接：https://blog.csdn.net/qq_24099547/article/details/107835285

版权

索引是帮助MySQL高效获取数据的排好序的数据结构

索引数据结构

引子
假设我们有一个两列7行的表
在这里插入图片描述
假设我们要查第六条数据,select * from t where col2 = 89,如果col2字段没有做索引,在查询时就会从表的第一行开始逐行遍历,找6次磁盘io才能找到这条记录,

假设我们对col2做了索引,底层是二叉树,我们每插入一条数据,都会讲索引字段的值放到二叉树中,最终形成如下索引树
在这里插入图片描述
此时我们要查89,从根节点开始查找,89大于34,所以从34的右子节点继续往下找,只要找4次就能找到了

二叉树的一个节点存储的结构实质上是key-value的结构,key是存储的索引值,value是索引值所在那行数据在磁盘文件中的地址

弊端:
当我们用col1列作为索引时,索引树如下
在这里插入图片描述
二叉树如果插入的是单边增长/减少的数据,二叉树退化成链表,我们知道链表做查询是非常慢的,我们要查col1=6,也要查6次,跟逐行查找没有区别

所以mysql的存储结构并没有使用二叉树

使用红黑树后,单边增长时,做了平衡
在这里插入图片描述
弊端:
数据量越大,高度越高,查找效率越低

存储大数量级别时,树的高度无法控制.例如索引是1~100w的单边增长数据,此时树的高度就有50w层…要查找一个叶子节点的数据,就要经过50w次的磁盘io,显然很不合理

刚刚说了红黑树的缺点,无法控制树的高度,那我们有没有办法可以将树的高度控制在一个比较小的范围中呢?

我们可以在每个节点多存储一些数据
在这里插入图片描述
mysql对每个节点的大小设置为16kb

是B-Tree的变种

在这里插入图片描述

存储引擎最终是作用到数据库表的

两个存储引擎底层都使用了B+tree

在这里插入图片描述

一张myisam表,会在磁盘中形成三个文件

myisam索引文件和数据文件是分离的(非聚集)
在这里插入图片描述
例如我们查找15,首先在MYI文件中在叶子节点获取到15所在行记录的磁盘文件地址指针 0x07,然后根据此地址去MYD文件中找到这条记录

InnoDB索引实现(聚集)

在这里插入图片描述

关注