Mysql存储引擎 和 索引结构推导(面经)

Mysql存储引擎说明

mysql的存储引擎有两种,InoDB(聚簇性索引),MySIAM(非聚簇性索引)
这里聚簇性和非聚簇性,含义指的是什么,我们先要理解InoDB和MySIAM的存储结构。

存储引擎结构文件是否支持事务存储空间
InoDBfrm(表结构定义文件) idb(索引和数据)支持
MySIAMfrm (表结构定义文件) MYYD(数据) MYYI(索引)不支持

顾名思义聚簇性索引就是索引和数据放在一起。同时InoDB支持事务,但是MySIAM不支持。所以市面上大部分业务性系统都会采用InoDB。

在InoDB中,frm结构文件和MySIAM中frm几乎一样,没有什么区别。但是idb文件中包含了索引文件和存储的数据。MYYD(数据) MYYI(索引)数据和索引是分开的。

文件存储内容
idb主键索引
非主键索引
数据
MYYI索引
MYYD数据

在idb中索引被分成两类-主键索引 、非主键索引。 主键索引是在记录插入时自动创建。非主键索引一般是我们进行性能优化时手动创建。同时非主键索引的节点存储的主键索引的key,主键索引的节点指向 数据。也就是说,通过非主键索引查询数据时,在InoDB中会先定位非主键索引的key,然后取得主键索引的key,最后通过主键索引取到数据。虽然结构稍微复杂了一点,但是很节省存储空间。

但是在MYYI中,只存储了索引,先去查索引,节点中存储的是数据在MYYD中的内存位置。在去指定的内存位置取得数据。

索引结构推导

几乎了解过索引的都知道,索引的底层数据结构是B+树,但是为什么使用B+树,而不是B树或者红黑树和AVL树。

推导的起始点是二叉查找树(BST),二叉查找树的时间复杂度是 O(lgn),极端情况下会退化为线性链表,二分查找也会退化为遍历查找,时间复杂退化为 O(N),检索性能急剧下降。
在这里插入图片描述
在这里插入图片描述

接下来就是AVL树和红黑树,
红黑树是一个相对平衡树,右节点比根节点大,左节点比根节点小。所以插入数据,结构变换简单,最多三次旋转就可以形成新的树,但是在海量的数据插入后,难免会出现左倾或者右倾的现象,所以数据越多,查询效率越低。
在这里插入图片描述
在这里插入图片描述

针对于AVL树来说,查询效率肯定是高的,对于整个树来说都是绝对平衡的,所以插入数据后变换很复杂,因此插入效率效率极其低下。
在这里插入图片描述

所以我们会引入一种的数据结构叫做B树。B树的一个节点会有多个key,当key数量大于限制值,会进行分裂,形成一个新的节点。而且B+的时间复杂度是O(h log n) ,h是树的高度,n是节点数。所以在大量数据的情况下,查询效率依旧很优秀。
在这里插入图片描述

但是数据库的索引还要解决一个问题就是范围查询,虽然B树的节点也是顺序的,但是还是需要引入B+树,将所有节点顺序串联在一起,这样就进一步提升了范围查询效率。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值