Mysql索引的结构——B++ Tree

最新推荐文章于 2024-09-19 08:44:28 发布

Climber47

最新推荐文章于 2024-09-19 08:44:28 发布

阅读量1.1k

点赞数 28

分类专栏：基础组件学习 # Mysql 文章标签： mysql 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ws_te47/article/details/135827541

版权

基础组件学习同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

本文介绍了Mysql中索引的使用，重点讲解了B+树的数据结构和原理，对比了B+树与B树、二叉树以及哈希表在性能上的差异，强调了B+树在处理大规模数据和范围查询上的优势。

摘要由CSDN通过智能技术生成

前言

索引是Mysql中常用到的一个功能，可以大大加快查询速度，同时面试中也是经常碰到。本文是学习Mysql索引的归纳总结。

索引采用的数据结构——B+树

本部分主要是参考自小林Coding

B+树的由来

二分查找可以每次缩减一半，从而提高查找效率。

但是二分查找，若使用线性结构，每次插入，都是需要移动其余剩下的全部元素，消耗巨大。

因此有了二分查找树。

但是二叉树若每次插入的都比其父节点大，则会演变为链表，从而使查询复杂度从 O(logn)降低为 O(n)。

因此有了自平衡二叉树，诸如AVL树或红黑树，其都是这样的自平衡二叉树。

但由于其本质还是一棵二叉树，所以会随着数据量增大，导致层数增加， IO操作增多（每一层IO多一次）。

因此有了B树。其每个节点允许有M个子节点，M是B树的阶，假设M为3，那就是阶为3的B树，其每个节点最多有2（M-1）个数据和3（M）个子节点。若超过，则分裂节点。

在这里插入图片描述

但是 B 树的每个节点都包含数据（索引+记录），每次IO都会需要查询到节点上记录的内容。若数据量大于索引的大小，那么在读取底层节点索引的时候，就会导致较多的IO操作。从而使性能受到巨大影响。

因此有了B+ 树，B+树和B树的结构其实相似，只是仅将数据存储在底层叶子节点。其余的子节点仅存储索引。从而解决了数据大、影响IO的问题。
其次，其底层叶子节点之间，既存了索引也存了记录。叶子节点之间通过链表连接起来。从而对于范围查询，可以大大提升效率。

B+树的结构

关于B++树的结构看图就好了。
在这里插入图片描述

在这里插入图片描述

B+树的叶子节点是单链表还是双向链表

网上很多探讨针对于“其叶子节点是单向链表还是双向链表”，包括小林也是做出了一次纠正。
在此文发现了一些结论与有趣的探讨。

在这里插入图片描述

顺着此，找到了一个结论——B+ 树中各个页之间是通过双向链表连接的，叶子节点中的数据是通过单向链表连接的。

在这里插入图片描述

为什么选用了B+ 树

这里直接复制小林的结论了。

B+ 树 vs B 树

B+Tree 只在叶子节点存储数据，而 B 树的非叶子节点也要存储数据，所以 B+Tree 的单个节点的数据量更小，在相同的磁盘 I/O 次数下，就能查询更多的节点。

另外，B+Tree 叶子节点采用的是双链表连接，适合 MySQL 中常见的基于范围的顺序查找，而 B 树无法做到这一点。

B+ 树 vs 二叉树

对于有 N 个叶子节点的 B+Tree，其搜索复杂度为O(logdN)，其中 d 表示节点允许的最大子节点个数为 d 个。

在实际的应用当中， d 值是大于100的，这样就保证了，即使数据达到千万级别时，B+Tree 的高度依然维持在 3~4 层左右，也就是说一次数据查询操作只需要做 3~4 次的磁盘 I/O 操作就能查询到目标数据。

而二叉树的每个父节点的儿子节点个数只能是 2 个，意味着其搜索复杂度为 O(logN)，这已经比 B+Tree 高出不少，因此二叉树检索到目标数据所经历的磁盘 I/O 次数要更多。

B+ 树 vs Hash

Hash 在做等值查询的时候效率贼快，搜索复杂度为 O(1)。

但是 Hash 表不适合做范围查询，它更适合做等值的查询，这也是 B+Tree 索引要比 Hash 表索引有着更广泛的适用场景的原因。

关注

28
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Climber47 CSDN认证博客专家 CSDN认证企业博客

码龄4年

79: 原创

2万+: 周排名

2万+: 总排名

8万+: 访问

: 等级

1939: 积分

846: 粉丝

1098: 获赞

33: 评论

1004: 收藏

私信

关注

热门文章

分类专栏

最新评论

小猿口算跟风版——没想到吧，这也能暴力
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
小猿口算跟风版——没想到吧，这也能暴力
NineTeen_sue: 我写了一个，通过lspatch给小源口算刷入justtrustme模块，通过proxypin进行抓包，在你开始答题的时候，会通过一个有exams字样的URL给你发送题目，里面包含了答案，我个人通过手动复制到TXT，然后依次匹配“>”等直接绘制，这个适用于练习做题不知道为什我的模拟器失效，进行HTTPS代理后完成题目无法正常提交，所以我选择了adb，实测最速0.4 题/s 因为开头要复制，所以。。。。现在列北京亿以内比大小第七
Golang中for和for range语句的使用技巧、对比及常见的避坑
IT民工锦里: 下面是for range遍历 0 1 0xc00000a0e0 0xc00000a0b8 1 2 0xc00000a0f8 0xc00000a0f0 2 3 0xc00000a110 0xc00000a108 下面是for遍历 0 1 0xc00000a120 0xc000010120 1 2 0xc00000a130 0xc000010128 2 3 0xc00000a140 0xc000010130 我跑出来的结果也没你说的现象？
Golang中for和for range语句的使用技巧、对比及常见的避坑
IT民工锦里: //expect: 1 2 fmt.Println(*res[0],*res[1]) //but output: 2 2，这个编辑器跑出来，输出的就是1.2啊
Golang Copy()方法学习
而鱼儿and-fish: 你是正确的，这个社区有些人连抄都要抄个错误的

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。