什么是 B+ 树❓

最新推荐文章于 2024-08-09 21:27:22 发布

if 0 = -I can

最新推荐文章于 2024-08-09 21:27:22 发布

阅读量354

点赞数 1

分类专栏：趣味小知识文章标签： B+ 树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-NC-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42018518/article/details/101707256

版权

趣味小知识专栏收录该内容

4 篇文章 0 订阅

订阅专栏

通过什么是 B-树❓相信大家也基本上明白了啥是 B-树。那 B+ 树又是个啥？

其实 B+ 树是基于 B-树的一种变体，有着比 B-树更高的查询性能。

在细说 B+ 树之前，我们先来回顾一下 B-树的几大特征。

一个 m 阶的 B-树具有如下几个特征：

1. 根节点至少有两个子女。

2. 每个中间节点都包含 k-1 个元素和 k 个孩子，其中 m/2 <= k <=m

3. 每一个叶子节点都包含 k-1 个元素，其中 m/2 <= k <=m

4. 所有叶子节点都位于同一层

5. 每个节点中的元素从小到大排列，节点当中 k-1 个元素正好是 k 个孩子包含的元素的值域分划。

B+ 树和 B-树有一些共同点，但是 B+ 树也具备一些新的特征。

一个 m 阶的 B+ 树具有如下几个特征：

1. 有 k 个子树的中间节点包含有 k 个元素（B-树中是 k-1 个元素），每个元素不保存数据，只用来索引，所有数据都保存在叶子节点。

2. 所有的叶子节点中包含了全部元素的信息，及指向含这些元素记录的指针，且叶子节点本身依关键字的大小自小而大顺序链接。

3. 所有的中间节点元素同时存在于子节点，在子节点元素中是最大（或最小）元素。

是不是觉得概念好烦，看不懂哎。。。。。。

别急，我们用具体例子来看一看 B+ 树的结构。

大家是不是很想说这是什么怪树，不但节点之间含有重复元素，而且叶子节点还用指针连在一起。

其实这些正是 B+ 树的几大特征。首先，每一个父节点元素都出现在子节点中，是子节点最大（或最小）元素。

在上面这棵树中，根节点元素 8 是子节点 2，5，8 的最大元素，也是叶子节点 6，8 的最大元素。

根节点元素 15 是子节点 11，15 的最大元素，也是叶子节点 13，15 的最大元素。

需要注意的是，根节点最大的元素（这里是 15），也就等同于整个 B+ 树的最大元素。以后无论插入删除多少元素，始终要保持最大元素在根节点当中。

至于叶子节点，由于父节点的元素都出现在子节点，因此所有叶子节点包含了全量元素信息。

并且每一个叶子节点都带有指向下一个节点的指针，形成了一个有序列表。

B+ 树还具有一个特点，这个特点是在索引之外，确实至关重要的特点。那就是【卫星数据】的位置。

所谓卫星数据，指的是索引元素所指向的数据记录，比如数据库中的某一行。在 B-树中，无论中间节点还是叶子节点都带有卫星数据。

B-树中的卫星数据（Satellite Information）：

而在 B+ 树当中，只有叶子节点带有卫星数据，其余中间节点仅仅是索引，没有任何数据关联。

B+ 树中的卫星数据（Satellite Information）：

需要补充的是，在数据库的聚集索引（Clustered Index）中，叶子节点直接包含卫星数据。在非聚集索引（NonClustered Index）中，叶子节点带有指向卫星数据的指针。

是不是大体有点明白了。但大家应该也会有所疑问：B+ 树设计成这样子，究竟有什么好处呢？

B+ 树的好处主要体现在查询性能上。

下面我们分别通过单行查询和范围查询来做分析。

在单元素查询的时候，B+ 树会自顶向下逐层查找节点，最终找到匹配的叶子节点。比如我们要查找的是元素 3

第 1 次磁盘 IO：

第 2 次磁盘 IO：

第 3 次磁盘 IO：

是不是查询流程看起来跟 B-树差不多。

不是的，有两点不同。

首先，B+ 树的中间节点没有卫星数据，所以同样大小的磁盘页可以容纳更多的节点元素。这就意味着，数据量相同的情况下，B+ 树的结构化比 B-树更加“矮胖”，因此查询时 IO 次数也更少。

其次，B+ 树的查询必须最终查到叶子节点，而 B-树只要找到匹配元素即可，无论匹配元素处于中间节点还是叶子节点。

因此，B-树的查找性能并不稳定（最好情况是只查根节点，最坏情况是查到叶子节点）。而 B+ 树的每一次查找都是稳定的。

下面我们再来看看范围查询。B-树如何范围查询呢？只能依靠繁琐的中序遍历。比如我们查询的范围为 3 到 11 的元素：

知识点：中序遍历（LDR）是二叉树遍历的一种，也叫做中根遍历、中序周游。在二叉树中，中序遍历首先遍历左子树，然后访问根结点，最后遍历右子树。

B-树的范围查找过程

自顶向下，查找到范围的下限（3）：

中序遍历到元素 6：

中序遍历到元素 8：

中序遍历到元素 9：

中序遍历到元素 11，遍历结束：

是不是发现 B-树的范围查询确实很繁琐呀。

反观 B+ 树的范围查询，则要简单得多，只需要在链表上做遍历即可：

B+ 树的范围查找过程

自顶向下，查找到范围的下限（3）：

通过链表指针，遍历到元素 6，8：

通过链表指针，遍历到元素 9，11，遍历结束：

是不是，是不是要比 B-树的中序遍历要简单得多。

综合起来，B+ 树比 B-树的优势有三个：

1. IO 次数更少；

2. 查询性能稳定；

3. 范围查询简便。

至于 B+ 树的插入和删除，过程与 B-树大同小异，我在这里就不详细描述了。

最后我们总结一下，B+ 树的特征和优势

B+ 树的特征：

1. 有k个子树的中间节点包含有k个元素（B树中是k-1个元素），每个元素不保存数据，只用来索引，所有数据都保存在叶子节点。

2. 所有的叶子结点中包含了全部元素的信息，及指向含这些元素记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。

3. 所有的中间节点元素都同时存在于子节点，在子节点元素中是最大（或最小）元素。

B+ 树的优势：

1. 单一节点存储更多的元素，使得查询 IO 次数更少。

2. 所有查询都要查找到子节点，查询性能稳定。

3. 所有叶子节点形成有序链表，便于范围查询。

Y(^o^)Y 好了，关于 B+ 树就介绍到这里！

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。