MySQL底层采用B+ tree的原因探究

最新推荐文章于 2023-02-19 19:22:11 发布

popofzk

最新推荐文章于 2023-02-19 19:22:11 发布

阅读量1.1k

点赞数

分类专栏： Java 文章标签： mysql b树哈希算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/popofzk/article/details/122709961

版权

Java 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

MySQL索引底层采用B+ tree的原因

哈希索引

https://www.cs.usfca.edu/~galles/visualization/ClosedHash.html

通过哈希函数计算和类似取余运算，可以将元素插入到对应的bucket中，find的过程是o(1)时间复杂度，那find速度这么快，为啥Mysql底层不用呢？

在这里插入图片描述

因为Mysql的查询涉及大量的范围查询，Hash索引这个无序集合，是不支持范围查询的，再比如mysql的排序查询（order by），而哈希是无序的，也无法支持！就像我们的uuid是无序的，不可能用他来做主键。

平衡二叉树

https://www.cs.usfca.edu/~galles/visualization/AVLtree.html

平衡二叉树的左右子树的高度差不会大于1。

无论怎么插，高度差都会维持，

随着树的高度增加，他的查询速度也会逐渐变慢，

比如这里找8，一次就找到了，但是找10找了三次。

还有一个致命缺点，如果我们去查5，通过三次定位找到了5，如果要找大于5的数据，就要从5这个节点往回查找，找到6，7，再回到更上一层的8，往下再9、10，这样才把大于5的数据找出来了，想象一下，如果大于5的数据特别多，那么回旋查询的次数就会增多，在这种范围查找上的效率很低。

这就是平衡二叉树的缺点：

高度越高，查询速度越慢
范围查找需要回旋的次数很大，效率低

在这里插入图片描述

在这里插入图片描述

B树

https://www.cs.usfca.edu/~galles/visualization/BTree.html

在这里插入图片描述

B树最大的特点就是一个节点可以存两个值

这样存储有什么好处呢？

对比平衡二叉树，同时存10个数字的情况下，平衡二叉树有4层，而B树只有三层。

树的高度上面，B树更优（毕竟一个节点存放的数字更多了，更紧凑）

变矮之后的好处就在于：查询的效率变高了，查数字的速度更快了

样例：之前平衡树找10需要找3次，而B树只用了2次。

所以，从平衡二叉树->B树，解决了树的高度的问题，树越矮，查询的效率越高。

那么，B树存在回旋查找的问题吗？答案是肯定的：

比如要查找大于5的数，一样需要回旋到上一层的6、8…，所以B树的范围查找仍然不太理想。

B+ Tree

https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html

在这里插入图片描述

B+树彻底解决了回旋查找的问题

它和B树的共同特点是一个节点可以存两个值，B+树和B树的明显区别就在叶子节点，B+树用了一个链表去解决了回旋查找的问题（比如查找大于5的数，找到5之后，通过链表直接把后面的数字全拿出来了），所以范围查找的效率极高。

这也解释了为什么排序的时候要用索引去排序，因为B+树已经帮我们排好序了！我们按照索引排序的话，就不会触发文件内排序了！

上面的树和叶子节点的关系：

凡是非叶子结点出现的数组都会出现的叶子节点
非叶子节点只存储key，不存储value，这里的key就是这些数字索引，而叶子节点存储的除了key之外，还有value（数字的地址）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
MySQL底层采用B+ tree的原因探究

MySQL索引底层采用B+ tree的原因哈希索引https://www.cs.usfca.edu/~galles/visualization/ClosedHash.html通过哈希函数计算和类似取余运算，可以将元素插入到对应的bucket中，find的过程是o(1)时间复杂度，那find速度这么快，为啥Mysql底层不用呢？因为Mysql的查询涉及大量的范围查询，Hash索引这个无序集合，是不支持范围查询的，再比如mysql的排序查询（order by），而哈希是无序的，也无法支持！就像我们
复制链接

扫一扫

专栏目录

popofzk CSDN认证博客专家 CSDN认证企业博客

码龄7年

53: 原创

7万+: 周排名

45万+: 总排名

9万+: 访问

: 等级

1075: 积分

75: 粉丝

122: 获赞

85: 评论

652: 收藏

私信

关注

热门文章

分类专栏

最新评论

百万抽奖系统设计架构入门
大卡蛇: 原创是否有点过分了哥们https://mp.weixin.qq.com/s/4OqYCnEV3xTmXYGT2w7ltg
Convlstm时空预测（keras框架、实战）
龙少568: 你好，可以分享一下代码吗？谢谢博主
Convlstm时空预测（keras框架、实战）
Axeio: 您好，冒昧打扰了。请问《Convlstm时空预测（keras框架、实战）》您所用的代码可以分享一下吗？我也是要做毕业设计，这方面的案例实在太少了（
Convlstm时空预测（keras框架、实战）
huilinjiang: 你好，模型建好了，我在训练的时候报错AttributeError: module 'tensorflow' has no attribute 'extract_image_patches' 是tensorflow的版本问题吗，还是啥原因啊
Convlstm时空预测（keras框架、实战）
huilinjiang: 我用12个50*50的矩阵，预测1个50*50的矩阵，为什么报错这个啊 ValueError: Dimension size must be evenly divisible by 37500 but is 25000 for '{{node DSSIMObjective/Reshape}} = Reshape[T=DT_FLOAT, Tshape=DT_INT32](IteratorGetNext:1, DSSIMObjective/Reshape/shape)' with input shapes: [10,50,50], [4] and with input tensors computed as partial shapes: input[1] = [?,50,50,15].

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。