B树详解

B树

B树,一般都被叫做B-树。

定义

  • B树中的每个节点的元素和子树数量是有限的,除了根节点外,所有节点最多拥有M-1个元素,所有非叶子非根节点最多拥有M个子树,即为M阶树。
  • 根节点至少拥有两个子树,除了根节点之后的非叶子节点拥有K个子树以及K-1个元素((M+1)/2<K<M),元素按照递增或递减顺序排列
  • 所有叶子节点属于同一层

B树的查找

因为B树当中一个节点对应的K个子树和它k-1个元素,所有,我们只需要判断查找的key和当前节点的所有元素的大小关系就可以判断数据的范围。
B数的一个节点当中拥有K-1个元素和K个子树,我们用keys和childs来存储,并且我们知道,keys当中的元素是有序的。child中的子树对应keys中元素分割得到的区间。
首先我们查找node.keys当中大于等于key的位置,我们命名为pos。如果pos等于len(node.keys)或者node.keys[pos] != key,说明当前节点不是我们要找的,我们要继续搜索子树。

举个例子:

在这里插入图片描述
比如我们要搜索7,首先我们在根节点当中找到第一个大于等于7的位置,这个位置的元素是9不等于7,说明当前节点当中没有7,我们需要继续往子树递归查找。由于子树对应元素分割出来的区间,所以我们可以确定如果7存在子树当中,只会出现在9前面的子树中,所以我们往9的下标的子树,也就是node.childs[1]的子树方向递归。

B树的插入

和查找相比,B树的插入要复杂一些。
B树的插入有一个原则,那就是所有的插入操作只发生在叶子节点。这点其实很容易想明白,因为如果要插入的key在非叶子节点,那么这就变成了修改操作了,我们直接修改原key对应的value。如果插入的key不在非叶子节点,那么显然我们可以一直查找到叶子节点。
在这里插入图片描述
比如这张图当中,3-9的根节点将整个区间分割成了小于3,3到9和大于9这三个区间。无论我们要插入的key是什么,要么落在区间边界,要么落在某个区间里。落在边界的情况就是key值出现在了非叶子节点的keys当中,我们直接修改它对应的value即可,如果出现在区间里,那么显然应该在叶子节点当中添加一个值。
但是往叶子节点当中添加数据有一个小问题,那就是B树对于所有节点当中元素的数量是有限制的,不允许无限添加。所以我们需要对节点中元素超过数量的情况做处理。
B树针对这个问题的解决方案非常巧妙,它的措施很简单,用一句话概括就是通过分裂节点来实现减少节点当中元素的数量
有一个问题是我们分裂了节点之后,父节点当中的元素也应该增加才对,因为父节点的子树数量是和节点中元素的数量对应的。子节点分裂导致分支增加,那么显然父节点也应该增加一个元素才对。
的确如此,也是因为这个原因,所以叶子节点分裂之后,需要上传一个元素到父节点当中,来保证父节点中元素数量和子树数量保持合法。我们来看下面这个例子:

在这里插入图片描述

这是一个4阶的B树,我们先插入5,这时候中间叶子节点的元素数量达到3,这时还没有违反性质。我们再插入6:
在这里插入图片描述
这时叶子节点在连续插入两个元素之后数量大于等于M,那么我们需要将它一分为二,将中间节点上传给父节点。于是经过这个调整之后,父节点当中增加了一个元素,也增加了一个分支,保证了B树继续合法。
最后得到的结果如下:
在这里插入图片描述
但是你可能会问,那父节点当中上传了一个元素也可能导致父节点中元素数量超标啊,对于这个问题该怎么办呢?其实很简单,和你想的一样,我们继续分裂节点。
来看下面这个例子:
在这里插入图片描述
我们往其中插入13,会导致最后一个叶子节点数量超标,于是我们分裂节点,将中间元素11上传到父节点:

但是由于上传父节点也可能引起元素数量超标,所以我们要向上递归判断是否需要分裂节点的操作。此时父节点当中元素数量大于等于M,需要继续分裂:
在这里插入图片描述
分裂产生新生成的节点由于高度更高,代替了原本的根节点,成为了新的根节点。并且原来根节点的子树也发生了拆分,分别分配给新根节点的两个子树。也就是说我们在拆分节点的时候,除了要拆分keys之外,也需要拆分childs,并且将这些childs重新assign父指针。
在这里插入图片描述

B树的删除

所有删除的都是叶子节点

首先,我们来理清楚第一个要点。无论我们当前删除的元素是什么,最终都会落实在叶子节点上,也就是说所有的情况都可以转化成删除叶子节点的问题。
我知道这听起来很荒谬,因为很有可能我们要删除的元素并不在叶子节点,而在中间的某棵子树的根节点,怎么能说都能变成叶子节点的删除呢?
做到这点并不难,只需要我们做一个很简单的转化。
我们举个例子,在下面这张图中,假如我们要删除元素11,而11在根节点上,显然我们要删除的位置并不在叶子节点。
在这里插入图片描述
但是为了避免删除非叶子节点的元素,我们可以先找到11的后继节点。这里的后继节点指的是在这棵树上,比当前元素大的最小的节点。在这个图当中,11的后继节点是12,我们将12赋值给11,递归往下调用,转变成删除12,如图2:
在这里插入图片描述
当然,我们选出来的后继节点仍然可能并不是叶子节点,这没有关系,我们只需要重复执行以上操作即可。因为我们可以保证后继节点出现的位置在树上的深度只会比当前元素更大,不会更小。而树深是有限的,也就是说最多经过有限次转化,我们就可以把删除操作转嫁到叶子节点身上。
这一点是后续所有推导的前提,我们必须要搞清楚。

后继节点的求法

求后继节点是二叉搜索树当中非常常规的做法,思路本身很朴素,就是找到比某个key值大的最小的节点。

但是在树形节点上做这个操作会多一点步骤,没有二分法那么直观。对于一个节点来说,如果当前节点没有元素大于key,那么只有一种可能:后继节点在最右侧的子树上。因为最右侧的子树大于节点中所有的元素,所以可能出现比key大的值。
举个例子:
在这里插入图片描述
比如我们要求11的后继,对于根节点而言没有元素大于11,那么如果这个后继存在,必然在最右侧的子树当中。如果我们要求的是15的后继,那么显然即使我们搜索了最右侧的子树,也找不到合法的后继。
如果当前节点存在大于key的元素,那么有两种可能,一种可能是后继出现在子树上,还有一种可能是后继就在这个节点当中。
还是上面的图,如果我们要找10的后继,我们在根节点当中找到了比10大的11,但是我们此时还没有搜索子树,所以没有办法判断最后的答案是11还是子树当中有更优的解。
所以为了解决这个问题,我们需要将11这个元素作为备胎,传递给子树。如果子树找到了更优的解,那么就返回最优解,否则说明备胎就是最优解,那么就返回备胎。
删除之后的两种情况

在理解了这个问题之后,我们就可以愉快地讨论节点上删除元素的情况了。
之前我们说过了,一棵合法的B树,它叶子节点上的元素应该是K-1个,其中M//2 <= K <= M。
由于B树存在最少节点数的限制,所以伴随着我们删除元素,很有可能打破这个限制。针对这一情况,我们进行分别讨论。
假设叶子节点当中元素数量很多,我们删除一个仍然可以保证它是合法的。这种情况很简单,没什么好说的,直接删除即可。

详情参考下图:

在这里插入图片描述

在上图当中,M=4,也就是说我们最多允许一个节点出现4个分支,一个节点最少拥有4/2 - 1,也就是一个元素。
假如我们要删除的元素是19,由于节点3当中元素众多,即使删除掉一个元素,依然符合节点的要求,那么就不做任何操作。但如果我们删除的是10,由于节点10只有一个元素,如果删除了,那么就会破坏节点的最小元素数量的限制。

在这种情况下,只有一个办法,就是先删除,再和其他节点借。

和兄弟节点借
我们首先考虑和节点的兄弟节点借一个元素,这个思路很朴素。因为兄弟节点和当前节点的父亲节点相同,可以很方便地转移节点并保证树的性质。
显然对于一个叶子节点来说,它的兄弟节点最多只有两个,也就是它左侧的兄弟和右侧的兄弟。由于B树上的元素存在从左往右的递增性,我们认为右侧的是哥哥节点,左侧的是弟弟节点。其实借的顺序虽然会影响树的形状,但是并不会影响树的合法性。所以我们先和哥哥借再和弟弟借,或者是反过来都行。我个人是设置的先哥哥后弟弟的顺序。

还用之前的例子举例:

在这里插入图片描述
在上图当中,M=4,也就是说我们最多允许一个节点出现4个分支,一个节点最少拥有4/2 - 1,也就是一个元素。
假如我们要删除的元素是19,由于节点3当中元素众多,即使删除掉一个元素,依然符合节点的要求,那么就不做任何操作。但如果我们删除的是10,由于节点10只有一个元素,如果删除了,那么就会破坏节点的最小元素数量的限制。
在这种情况下,只有一个办法,就是先删除,再和其他节点借。

我们首先考虑和节点的兄弟节点借一个元素,这个思路很朴素。因为兄弟节点和当前节点的父亲节点相同,可以很方便地转移节点并保证树的性质。

显然对于一个叶子节点来说,它的兄弟节点最多只有两个,也就是它左侧的兄弟和右侧的兄弟。由于B树上的元素存在从左往右的递增性,我们认为右侧的是哥哥节点,左侧的是弟弟节点。其实借的顺序虽然会影响树的形状,但是并不会影响树的合法性。所以我们先和哥哥借再和弟弟借,或者是反过来都行。我个人是设置的先哥哥后弟弟的顺序。

还用之前的例子举例:
在这里插入图片描述
假设我们要删除节点10,节点10只有一个元素,删除了必然破坏合法性。这个时候我们先看下哥哥的情况,哥哥节点当中有3个元素,即使借走一个仍然可以满足要求,那么我们就和哥哥借。

借的方法很简单,由于哥哥节点当中所有的元素都大于当前节点,所以显然为了保证元素顺序,我们会借第一个元素,也就是13。但是13是大于父节点中的12的,所以我们不能直接把13塞到原来10的位置,而需要先将父节点的12挪下来,放到10的位置,再将13填到12的位置上去。如果你熟悉平衡树的话,你会发现这其实是一个左旋操作,如果你不熟悉的话,也不用纠结。

最后达到平衡态的样子如下:

在这里插入图片描述
同理,如果我们要删除的是23,由于它没有哥哥节点,只有弟弟节点,并且弟弟节点满足条件。那么我们就和弟弟节点借一个元素,逻辑和上面一样。我们先从父节点要一个元素下来,再从弟弟节点借一个元素放回父节点。得到的结果如下:
在这里插入图片描述
同理,如果我们要删除的是23,由于它没有哥哥节点,只有弟弟节点,并且弟弟节点满足条件。那么我们就和弟弟节点借一个元素,逻辑和上面一样。我们先从父节点要一个元素下来,再从弟弟节点借一个元素放回父节点。得到的结果如下:

在这里插入图片描述

兄弟节点也是穷光蛋

既然存在兄弟节点可以借那么显然也会存在兄弟节点借不了的情况,如果兄弟节点自身也是勉强达到条件,显然是借不了的。这种时候没办法,只能还是和父亲节点要。如果父亲节点稍稍富裕,给出了一个元素之后还是能满足条件,那么就从父亲节点出。但是这里需要注意,父亲节点给出去了一个元素,那么它的子树数量也应该随之减少,不然也会不满足B树的特性。为了达成这一点,可以通过合并两个子树来实现。

我们来看个例子,会更直观一些,比如在下图当中,我们继续删除10:
在这里插入图片描述
删除之后,会得到:
在这里插入图片描述
你会发现这个图很奇怪,除了比较丑之外,最大的问题就是它的根节点有两个元素,但是却有四颗子树,这显然违反了B树的性质。

违反性质的原因是因为原本属于根节点的元素9被子树借走了,所以为了解决这个问题,我们需要将邻近的两棵子树合并。也就是将[6, 7]和[9]子树合并,得到:

在这里插入图片描述
稍微想一下会发现这其实是添加节点时分裂的逆操作,所以从本质上来说我们添加元素时分裂节点输送一个元素进入父节点和删除的时候从父亲节点借走一个,然后合并两个子树是互为逆操作,本质是一回事。

到这里,我们还有最后一个问题没解决,当我们跟父节点借合并子树时同样会导致父节点中的元素数量减少,万一父节点减少了一个元素之后也不满足条件应该怎么办?你可能会觉得是不是跟子节点借?其实想一下就会知道这不可行。原因也很简单,因为即使我们能找到富裕的子节点,但是也没办法让子树的数量随着也增加1。

解决这个问题的方法也不难,我们只需要递归借节点的操作,让父节点去和它的兄弟以及父节点借元素就好了。在极端情况下,这很有可能导致树的高度发生变化,比如:

在这里插入图片描述
上图是一个阶数为5的B树,如果我们删除7,根据刚才的惯例,我们会跟父亲节点借元素6,并且和[1, 3]子树合并,得到:

在这里插入图片描述
但是这一借会导致父节点破坏了B树的最低元素要求,所以我们需要递归维护父节点。也就是让父节点去重复借元素的步骤,我们可以发现对于节点[10]来说,它没有富裕的兄弟节点,只能继续和父节点借,这一借会再一次导致合并的发生,最终我们得到的结果如下:

在这里插入图片描述
我们观察一下上面树结构的变化,可以发现只要是和父亲节点借元素,必然伴随着和兄弟节点合并的情况。而和兄弟节点合并,除了需要维护两个节点当中的元素之外,还需要维护各自的子树。尤其是如果我们在每个节点当中记录父亲节点以及在父亲节点当中的位置的话,这些都需要维护。这也是B树实现比理解困难的原因。

另外,删除和添加元素时都有可能引起根节点的变化,所以我们还需要做好判断,在更新树结构的同时更新根节点。

转载于:https://mp.weixin.qq.com/s?__biz=MzUyNjQxNjYyMg==&mid=2247487737&idx=2&sn=7931571c4647c709cd07fbcbaa3d6f32&chksm=fa0e7f78cd79f66e331b35437185bb890f6e2f039aeed41d8d823749b5812e5d6b9247d09266&scene=21#wechat_redirect

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值