B树，B+树，B*树

最新推荐文章于 2023-11-29 09:08:41 发布

莫非的Java

最新推荐文章于 2023-11-29 09:08:41 发布

阅读量254

点赞数

分类专栏：面试数据结构 B树

本文链接：https://blog.csdn.net/qq_30476717/article/details/107736328

版权

面试同时被 3 个专栏收录

23 篇文章 0 订阅

订阅专栏

数据结构

2 篇文章 0 订阅

订阅专栏

B树

1 篇文章 0 订阅

订阅专栏

数据库索引为什么要使用树结构存储呢？
因为树的查询效率高，而且可以保持有序。

如果我们利用二叉查找树或者红黑树作为索引结构，在寻找到每一个节点时，均会进行一次IO操作，造成大量磁盘ＩＯ操作（最坏情况下为树的高度）。即由于树深度过大而造成磁盘IO读写过于频繁，进而导致效率低下。
　　所以，我们为了减少磁盘ＩＯ的次数，就你必须降低树的深度，将“瘦高”的树变得“矮胖”。一个基本的想法就是：
　　（1）每个节点存储多个元素
　　（2）摒弃二叉树结构，采用多叉树
　　这样就引出来了一个新的查找树结构 ——多路查找树。**
先来介绍一下B树（Balance Tree）：

一、B树（Balance Tree）
B-树就是B树，没有所谓的B减树

B树是一种多路平衡查找树，B树中所有结点的孩子结点最大值称为B树的阶，通常用m表示。m的大小取决于磁盘页的大小，一个m阶的B树具有如下几个特征：

1.根结点至少有两个子女。
2.每个中间节点都包含k-1个元素和k个孩子，其中 ceil（m/2） ≤ k ≤ m
3.每一个叶子节点都包含k-1个元素（关键字），其中 ceil（m/2） ≤ k ≤ m
4.所有的叶子结点都位于同一层。
5.每个节点中的元素从小到大排列，节点当中k-1个元素正好是k个孩子包含的元素的值域划分
如下图：
在这里插入图片描述
B树比较的次数并不比二叉查找树少，尤其是当某一节点中的数据很多时，但是磁盘IO的次数却是大大减少。比较是在内存中进行的，相比于磁盘IO的速度，比较的耗时几乎可以忽略。所以当树的高度足够低的话，就可以极大的提高效率。相比之下，节点中的元素多点也没关系，仅仅是多了几次内存交互而已，只要不超过磁盘页的大小即可。这就是B树的优势。

B树的应用：
①B树主要用于文件系统以及部分数据库索引，例如：非关系型数据库MongoDB。而大部分关系数据库则使用B+树做索引，例如：Mysql数据库；
②从查找效率考虑一般要求B树的阶数m >= 3;
③B-树上算法的执行时间主要由读、写磁盘的次数来决定，故一次I/O操作应读写尽可能多的信息。因此B树的结点规模一般以一个磁盘页为单位。一个结点包含的关键字及其孩子个数取决于磁盘页的大小。

关于B树的参考文章（本文的内容汇总了这两篇文章的纲领性内容，侵删）：

https://juejin.im/post/6844903753330622471（漫画形式，较为直观）
https://blog.csdn.net/z_ryan/article/details/79685072?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.edu_weight&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.edu_weight

下面来介绍一下B+树。
B+树：
B＋树是Ｂ树的变种，有着比Ｂ树更高的查询效率。下面，我们就来看看B+树和B树有什么不同。
一个m阶的B+树具有如下几个特征：
1.有k个孩子的中间节点包含有k个元素（而B树中是k-1个元素），每个元素不保存数据，只用来索引，所有数据都保存在叶子节点。
2.所有的叶子结点中包含了全部元素的信息，叶子结点本身按照元素（关键字）的大小自小而大顺序排列，叶子节点之间是一个双向循环链表结构。
3.所有的父节点元素都同时存在于子节点中，是子节点元素中的最大（或最小）元素。

如下图所示：
在这里插入图片描述
B+树和B树两者的不同点在于：
（1）卫星数据的位置：所谓卫星数据即索引元素所指向的数据记录，比如数据库中的某一行，Ｂ树每个结点中的每个关键字都有卫星数据；而在Ｂ＋树中，只有叶子结点带有卫星数据，其余中间节点仅仅是索引，没有任何数据关联。而这就意味着对于B+树，同样的大小的磁盘页可以容纳更多节点元素，在相同的数据量下，Ｂ＋树更加“矮胖”，ＩＯ操作更少。
B树中的卫星数据（Satellite Information）：
在这里插入图片描述
B+树中的卫星数据（Satellite Information）：

需要补充的是，在数据库的聚集索引（Clustered Index）中，叶子节点直接包含卫星数据。在非聚集索引（NonClustered Index）中，叶子节点带有指向卫星数据的指针。