文章目录
0. 前言
为了能够给后章节的红黑树做个铺垫,先学习一下B树。
1. B树(B-Tree、B-树)
B 树是一种平衡的 多路 搜索树,多用于文件系统、数据库的实现(MySQL在 B 树进行改进)。
仔细观察 B 树,特征如下:
- 1 个节点可以存储超过 2 个元素、可以拥有超过 2 个子节点
- 拥有二叉搜索树的一些性质
- 平衡,每个节点的所有子树高度一致
- 比较矮
B 树好像由 Balance 而来,因为它实在是太平衡了
2. m阶B树的性质(m ≥ 2)
一个节点最多有 m 个子节点称为 m 阶 B树
m 阶 B树一个节点最多有 m - 1 个数据元素
元素个数规律如下:
┌ m/2 ┐对 m / 2 进行向上取整,ceiling。
反之,向下取整,floor。
若 m = 2, 那 B 树就是 BST 二叉搜索树,一般数据库的实现需要用到 200 ~ 300 阶 B 树。
3. B树与二叉搜索树的关系
简单 2 代合并产生 4 个子节点的例子:
简单 2 代合并产生 3 个子节点的例子:
简单 3 代合并产生 8 个子节点:
4. 搜索数据
与 BST 树搜索类似:
- 先在节点内部从小到大开始搜索元素
- 如果命中,搜索结束
- 如果未命中,再去对应的子节点中搜索元素,重复步骤 1
5. 添加数据
新添加的元素必定是添加到叶子节点:
◼ 插入55:
◼ 插入95:
假设这是一颗 4 阶 B 树,再插入 98 后,最右下角的叶子节点元素个数将超过限制,即 m 阶 B 树的节点最多只能存 m - 1 个数据元素,若节点元素超过该限制,这种情况被称为上溢
6. 添加 – 上溢的解决(假设5阶)
在最极端情况下,一直上溢分裂到根节点,会导致 B 树的高度加一,这也是唯一导致 B 树高度增加的情况。
◼ 插入 98:
◼ 插入 52
◼ 插入 54
7. 删除数据
7.1 删除叶子节点
◼ 假如需要删除的元素在叶子节点中,那么直接删除即可
◼ 删除 30
7.2 删除非叶子节点
◼ 假如需要删除的元素在非叶子节点中,思想与 BST 树一致
- 先找到前驱或后继元素,覆盖所需删除元素的值(与 BST 删除方式一致)
- 再把前驱或后继元素删除
◼ 删除 60
1. 所以不论要删除的节点是 叶子 / 非叶子节点的话,真正删除的元素都是删除的叶子节点。
2. 新添加的元素必定是添加到叶子节点
这两点对 RB 树也是相当重要的
7.3 删除 —下溢的解决(假设5阶)
若删除 22 ,叶子节点被删掉一个元素后,元素个数可能会低于最低限制( ≥ ┌ m/2 ┐ − 1 )这种现象称为:下溢(underflow)。
旋转法解决下溢:
合并法解决下溢:
从上图发现,B 树是下溢问题若一致向上传播到根节点,会导致 B 树整体高度减一,这也是 B 树高度唯一减小的方式。
8. 4阶B树
如果先学习 4 阶 B 树(2-3-4树),将能更好地学习理解 红黑树
4阶B树:
- 所有节点能存储的元素个数 x :1 ≤ x ≤ 3
- 所有非叶子节点的子节点个数 y :2 ≤ y ≤ 4
可以手动操作下:从 1 添加到 22 及从 1 删除到 22,会理解的更加深刻。也可以去算法可视化,给为直观。