B~树（B-Tree）与Ｂ+树

最新推荐文章于 2024-04-08 13:34:36 发布

Java搬砖工程师

最新推荐文章于 2024-04-08 13:34:36 发布

阅读量377

点赞数

本文链接：https://blog.csdn.net/jialiuyang521/article/details/84871628

版权

注意：首先需要说明的一点是：B - 树就是 B ~树，没有所谓的B 减树

二叉查找树的查找的时间复杂度是Ｏ(log N)，其查找效率已经足够高了，

答案当然不是，原因是因为磁盘ＩＯ；

　　（1）每个节点存储多个元素
　　（2）摒弃二叉树结构，采用多叉树
这样就引出来了一个新的查找树结构 ——多路查找树。

下面来具体介绍一下B ~树（Balance Tree）

Ｂ~ 树

B~树的卫星数据：

示例：三阶B~树（实际中节点中元素很多）

查询
　　以上图为例：若查询的数值为５：
　　第一次磁盘ＩＯ：在内存中定位（与17、35比较），比17小，左子树；
　　第二次磁盘ＩＯ：在内存中定位（与８、12比较），比８小，左子树；
　　第三次磁盘ＩＯ：在内存中定位（与3、5比较），找到5，终止。

删除和添加操作，自带平衡，Ｂ~树是一个自平衡的树

比如，删除11

平衡为：

注意

①、B~树主要用于文件系统以及部分数据库索引，例如： MongoDB。
- 而大部分关系数据库则使用 B+树做索引，例如：mysql数据库；
②、从查找效率考虑一般要求B~树的阶数m >= 3;
③、B~树上算法的执行时间主要由读、写磁盘的次数来决定，故一次I/O操作应读写尽可能多的信息。
- 因此 B~树的结点规模一般以一个磁盘页为单位。
- 一个结点包含的关键字及其孩子个数取决于磁盘页的大小。

需要补充的是，

B+树的优势在于查找效率上，下面我们做一具体说明：

Ｂ＋树中间节点没有卫星数据（索引元素所指向的数据记录），只有索引，而Ｂ~树每个结点中的每个关键字都有卫星数据；
- 这就意味着同样的大小的磁盘页可以容纳更多节点元素，在相同的数据量下，Ｂ＋树更加“矮胖”，ＩＯ操作更少
因为卫星数据的不同，导致查询过程也不同；
- Ｂ~树的查找只需找到匹配元素即可，最好情况下查找到根节点，最坏情况下查找到叶子结点，所说性能很不稳定，
- 而Ｂ＋树每次必须查找到叶子结点，性能稳定
  - 原因是：B~树在内存中找到的可能是中间节点，需要继续遍历（io操作），
  - B+树在内存中匹配到数据节点

插入删除和B~树类似

B+树的卫星数据：

3阶的B+树：

B+树相比B~树的优势：

　　1.单一节点存储更多的元素，使得查询的IO次数更少；
　　2.所有查询都要查找到叶子节点，查询性能稳定；
　　3.所有叶子节点形成有序链表，便于范围查询。

关注