B树、B+树学习小记

本文介绍了B树和B+树的数据结构特性,包括它们的形态、查找、插入、删除操作及其复杂度分析。B树是一种多路查找树,支持高效查找,插入和删除,而B+树所有键值位于叶节点,便于范围查询,查找效率更稳定。
摘要由CSDN通过智能技术生成

B树

B树和二叉查找树类似,均是通过把数据储存成树的形态,支持数据的动态查找、插入和删除。不同于二叉查找树,B树是一棵多路树,也就是每个节点可以有若干儿子。这样在查找的时候,读取内存的次数就会大大降低,从而提高查找的效率。

B树的形态

对于取定的参数 m m m

  • B树是一棵多路树,每个节点最多有 m m m 个儿子。除了根节点和叶节点以外,每个节点最多有 ⌈ m 2 ⌉ \lceil\frac{m}{2}\rceil 2m 个儿子。若根节点有儿子,则至少有两个儿子。
  • 所有叶子节点都有相同的深度。
  • 每个键值在树中恰好出现一次。有 k k k 个儿子的节点储存了 k − 1 k-1 k1 个键值。其中第 i i i 个键值在第 i i i 个儿子的子树中键值的最大值和第 i + 1 i+1 i+1 个儿子的子树中键值的最小值之间。
    在这里插入图片描述
    以下是一棵 m = 3 m=3 m=3 的B树(又叫2-3树)
    在这里插入图片描述

查找操作

查找键值 k k k 的操作与二叉查找树的查找操作类似:从根节点开始,现在当前节点的键值中二分查找。若 k k k 在该节点中,则退出。否则找到 k k k 所在的子树,然后递归处理。

插入操作

插入一个键值后,B树的以下几个性质需要维护:

  • 所有叶子都有相同的深度。
  • 每个节点至多有 m − 1 m-1 m1 个键值和 m m m 个儿子。

插入操作的具体过程如下:

  • 找到位于最底层的相应节点,并将该键值插入到节点当中。
  • 若键值数超过 m − 1 m-1 m1,则将该节点分裂成两个,并将键值的中位数移动到父节点中。
  • 若父节点的键值数超过 m − 1 m-1 m1,则继续重复上面步骤。
  • 若最终导致根节点分裂,会使树的高度增加 1 1 1

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

删除操作

在B树中删除一个键值 k k k 的操作如下:

  • 找到键值 k k k 所在的节点。若不是叶节点,则不断将 k k k 与叶结点中的后继键值进行交换,直到 k k k 到达叶节点。在叶节点中删除键值 k k k

若删除后节点中的键值数少于 ⌈ m 2 ⌉ − 1 \lceil\frac{m}{2}\rceil-1 2m1,则需要进行调整:

若相邻的兄弟节点有至少 ⌈ m 2 ⌉ \lceil\frac{m}{2}\rceil 2m 个键值,不妨设为左兄弟,则将兄弟节点的一个键值移动到当前节点。具体来说:

  • 将父节点中最小的键值移动到当前节点。
  • 将左兄弟中最大的键值移动到父节点。

若相邻的兄弟节点没有足够的键值。

  • 将当前节点、兄弟节点以及父节点中分割这两个节点的键值合并成一个包含上述所有键值的新节点。
  • 若父节点的键值数少于 ⌈ m 2 ⌉ − 1 \lceil\frac{m}{2}\rceil-1 2m1,则不断进行上述处理。

下面是 m = 5 m=5 m=5 时删除操作的例子:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

复杂度分析

B树的第 0 0 0 层有 1 1 1 个节点(根节点),第 1 1 1 层至少有两个节点,第 k ( k ≥ 2 ) k(k\ge 2) k(k2) 层至少有 2 ⋅ ⌈ m 2 ⌉ k − 1 2\cdot\lceil\frac{m}{2}\rceil^{k-1} 22mk1 个节点。若有 N N N 个键值的B树高度为 k k k,则有 N + 1 ≥ 2 ⋅ ⌈ m 2 ⌉ k − 1 ⇒ k ≤ 1 + log ⁡ ⌈ m 2 ⌉ ( N + 1 2 ) N+1\ge 2\cdot\lceil\frac{m}{2}\rceil^{k-1}\Rightarrow k\le 1+\log_{\lceil\frac{m}{2}\rceil}(\frac{N+1}{2}) N+122mk1k1+log2m(2N+1)

因此树高是 O ( log ⁡ m N ) O(\log_m N) O(logmN) 级别的。

若在插入 N N N 个键值后B树中有 p p p 个节点,由除根以外每个节点至少有 ⌈ m 2 ⌉ \lceil\frac{m}{2}\rceil 2m 个儿子可知 N ≥ 1 + ( ⌈ m 2 ⌉ − 1 ) ( p − 1 ) ⇒ p − 1 ≤ N − 1 ⌈ m 2 ⌉ − 1 N\ge 1+(\lceil\frac{m}{2}\rceil-1)(p-1)\Rightarrow p-1\le \frac{N-1}{\lceil\frac{m}{2}\rceil-1} N1+(2m1)(p1)p12m1N1

也就是说插入时的平均分裂次数不超过 1 ⌈ m 2 ⌉ − 1 \frac{1}{\lceil\frac{m}{2}\rceil-1} 2m11

B+树

和B树的不同之处在于,所有键值都位于叶节点中,且每个非叶节点保存的是所有儿子节点中键值的最大(最小)值。

因此有 k k k 个儿子的节点中有 k k k 个键值。每个节点中最多有 m m m 个键值。

查找、插入和删除操作与B树类似。

和B树相比的优势:

  • 可以通过链表把所有叶节点串在一起,从而实现键值的范围查询。
  • 每次查找操作的深度相同,时间效率稳定。
  • 每个节点不需要存指向内存的指针,略微节省空间。
  • 一般树高要小于B树,效率更高。

B+树的变种

可以内部节点采用B树储存,叶节点使用B+树的结构。

文中的图片来自北大黄群老师开的数算实验班中的课件。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值