B树、B+树与B*树

最新推荐文章于 2022-03-08 15:32:19 发布

不升级的小怪兽

最新推荐文章于 2022-03-08 15:32:19 发布

阅读量204

点赞数

分类专栏：数据结构与算法

13 篇文章 0 订阅

订阅专栏

B树的定义

注：有人说B-树，其实就是B树，因为B树的原英文名称为B-tree

B树实示例图

B+-tree是应文件系统所需而产生的一种B-tree的变形树。

B+树中有n棵子树的结点中含有n个关键字，而B 树是n棵子树有n-1个关键字
B+树所有的叶子结点中包含了全部关键字的信息，及指向含有这些关键字记录的指针，所有的叶子结点和相连的节点使用链表按从小到大的顺序相连，便于区间查找和遍历。而B 树的叶子节点并没有包括全部需要查找的信息。
B+树所有的非终端结点可以看成是索引部分，结点中仅含有其子树根结点中最大（或最小）关键字。 (而B 树的非终节点也包含需要查找的有效信息)
B+树的叶子结点都是相链的，因此对整棵树的便利只需要一次线性遍历叶子结点即可。而B树则需要进行每一层的递归遍历。相邻的元素可能在内存中不相邻，所以缓存命中性没有B+树好。
B+树在内部节点上不包含数据信息，因此在内存页中能够存放更多的key。数据存放的更加紧密，具有更好的空间局部性。因此访问叶子几点上关联的数据也具有更好的缓存命中率。B树的优点：由于B树的每一个节点都包含key和value，因此经常访问的元素可能离根节点更近，因此访问也更迅速。

B+树示例图

1.所有关键字都出现在叶子结点的链表中（稠密索引），且链表中的关键字恰好是有序的；

2.不可能在非叶子结点命中；

3.非叶子结点相当于是叶子结点的索引（稀疏索引），叶子结点相当于是存储（关键字）数据的数据层；

4.更适合文件索引系统；

B*-tree是B+-tree的变体，在B+ 树非根和非叶子结点再增加指向兄弟的指针

B*树定义了非叶子结点关键字个数至少为(2/3)*M，即块的最低使用率为2/3（代替B+树的1/2）
B+树的分裂：当一个结点满时，分配一个新的结点，并将原结点中1/2的数据复制到新结点，最后在父结点中增加新结点的指针；B+树的分裂只影响原结点和父结点，而不会影响兄弟结点，所以它不需要指向兄弟的指针。
B*树的分裂：当一个结点满时，如果它的下一个兄弟结点未满，那么将一部分数据移到兄弟结点中，再在原结点插入关键字，最后修改父结点中兄弟结点的关键字（因为兄弟结点的关键字范围改变了）；如果兄弟也满了，则在原结点与兄弟结点之间增加新结点，并各复制1/3的数据到新结点，最后在父结点增加新结点的指针。
B*树分配新结点的概率比B+树要低，空间使用率更高；

B*树示例图