B-树的详解之增删改查

1、B-树的介绍


B-树其实就是我们平时所说的B树,除了B-树外,还有另外一种叫B+树,我们这里先介绍什么是B-树: 
B-树是一种平衡的多路查找树,它在文件系统中很有用(原因之前已经介绍了)。B-树的结构有如下的特点: 
**一棵度为m的B-树称为m阶B-树。一个结点有k个孩子时,必有k-1个关键字才能将子树中所有关键字划分 
为k个子集。B-树中所有结点的孩子结点最大值称为B-树的阶,通常用m表示。从查找效率考虑,一般要求 
m≥3。一棵m阶的B-树或者是一棵空树,或者是满足下列要求的m叉树:**

树中的每个结点至多有m颗子树。
若根结点不是叶子结点,则至少有两颗子树。
除根结点外,所有非终端结点至少有[ m/2 ] ( 向上取整 )颗子树。
所有的非终端结点中包括如下信息的数据
(n,A0,K1,A1,K2,A2,….,Kn,An) 
其中:Ki(i=1,2,…,n)为关键码,且Ki < K(i+1),

Ai 为指向子树根结点的指针(i=0,1,…,n),且指针A(i-1) 所指子树中所有结点的关键码均小于Ki (i=1,2,…,n),An 所指子树中所有结点的关键码均大于Kn. 
 è¿éåå¾çæè¿°
n 为关键码的个数。

所有的叶子结点都出现在同一层次上,并且不带信息(可以看作是外部结点或查找失败的结点,实际上这些结点不存在,指向这些结点的指针为空)。


2、B-树的基本操作–查找介绍


我们先给出如下的一个4阶的B-树结构。 

è¿éåå¾çæè¿°
如上图所示,这是我们的一个4阶的B-树,现在假设我们需要查找45这个数是否在B-树中。

从根节点出发,发现根节点a有1个关键字为35,其中45>35,往右子树走,进入节点c
发现结点c有2个关键字,其中其中43<45<78,所以进入结点g。
发现结点g有3个关键字,其中3<45<47,所以继续往下走,发现进入了结束符结点:F,所以45不在B-树中
OK,我们从上述的查找的过程可以得出,在B-树的查找过程为:

在B- 树中查找结点
在结点中查找关键字。
由于B- 树通常存储在磁盘上, 则前一查找操作是在磁盘上进行的, 而后一查找操作是在内存中进行的, 即 
在磁盘上找到指针p 所指结点后, 先将结点中的信息读入内存, 然后再利用顺序查找或折半查找查询等于K 
的关键字。显然, 在磁盘上进行一次查找比在内存中进行一次查找的时间消耗多得多. 
因此, 在磁盘上进行查找的次数、即待查找关键字所在结点在B- 树上的层次树, 是决定B树查找效率的首要 
因素,对于有n个关键字的m阶B-树,从根结点到关键字所在结点的路径上路过的结点数不超过: 

è¿éåå¾çæè¿°


3、B-树的插入


其实B-树的插入是很简单的,它主要是分为如下的两个步骤:

 1. 使用之前介绍的查找算法查找出关键字的插入位置,如果我们在B-树中查找到了关键字,则直接返回。否则它一定会失败在某个最底层的终端结点上。
 2.然后,我就需要判断那个终端结点上的关键字数量是否满足:n<=m-1,如果满足的话,就直接在该终端结点上添加一个关键字,否则我们就需要产生结点的“分裂”。
     分裂的方法是:生成一新结点。把原结点上的关键字和k(需要插入的值)按升序排序后,从中间位置把关键字(不包括中间位
面我们来举例说明,首先假设这个B-树的阶为:3。树的初始化时如下:

è¿éåå¾çæè¿°

首先,我需要插入一个关键字:30,可以得到如下的结果: 

è¿éåå¾çæè¿°

再插入26,得到如下的结果:

è¿éåå¾çæè¿°

OK,此时如图所示,在插入的那个终端结点中,它的关键字数已经超过了m-1=2,所以我们需要对结点进分裂,所以我们先对关键字排序,得到:26 30 37 ,所以它的左部分为(不包括中间值):26,中间值为:30,右部为:37,左部放在原来的结点,右部放入新的结点,而中间值则插入到父结点,并且父结点会产生一个新的指针,指向新的结点的位置,如下图所示: 
è¿éåå¾çæè¿°

OK,然后我们继续插入新的关键字:85,得到如下图结果: 

è¿éåå¾çæè¿°

 

正如图所示,我需要对刚才插入的那个结点进行“分裂”操作,操作方式和之前的一样,得到的结果如下: 
这里写图片描述

哦,当我们分裂完后,突然发现之前的那个结点的父亲结点的度为4了,说明它的关键字数超过了m-1,所以需要对其父结点进行“分裂”操作,得到如下的结果: 
这里写图片描述

好,我们继续插入一个新的关键字:7,得到如下结果: 
这里写图片描述

同样,需要对新的结点进行分裂操作,得到如下的结果: 
这里写图片描述

到了这里,我就需要继续对我们的父亲结点进行分裂操作,因为它的关键字数超过了:m-1. 
这里写图片描述

哦,终于遇到这种情况了,我们的根结点出现了关键子数量超过m-1的情况了,这个时候我们需要对父亲结点进行分列操作,但是根结点没父亲啊,所以我们需要重新创建根结点了。 
这里写图片描述

好了,到了这里我们也知道怎么进行B-树的插入操作。

 

4、B-树的删除操作


B-树的删除操作同样是分为两个步骤:

利用前述的B-树的查找算法找出该关键字所在的结点。然后根据 k(需要删除的关键字)所在结点是否为叶子结点有不同的处理方法。如果没有找到,则直接返回。
若该结点为非叶结点,且被删关键字为该结点中第i个关键字key[i],则可从指针son[i]所指的子树中找出最小关键字Y,代替key[i]的位置,然后在叶结点中删去Y。
如果是叶子结点的话,需要分为下面三种情况进行删除。

如果被删关键字所在结点的原关键字个数n>=[m/2] ( 上取整),说明删去该关键字后该结点仍满足B-树的定义。这种情况最为简单,只需删除对应的关键字:k和指针:A 即可。
如果被删关键字所在结点的关键字个数n等于( 上取整)[ m/2 ]-1,说明删去该关键字后该结点将不满足B-树的定义,需要调整。
调整过程为:如果其左右兄弟结点中有“多余”的关键字,即与该结点相邻的右兄弟(或左兄弟)结点中的关键字数目大于( 上取整)[m/2]-1。则可将右兄弟(或左兄弟)结点中最小关键字(或最大的关键字)上移至双亲结点。而将双亲结点中小(大)于该上移关键字的关键字下移至被删关键字所在结点中。

被删关键字所在结点和其相邻的兄弟结点中的关键字数目均等于(上取整)[m/2]-1。假设该结点有右兄弟,且其右兄弟结点地址由双亲结点中的指针Ai所指,则在删去关键字之后,它所在结点中剩余的关键字和指针,加上双亲结点中的关键字Ki一起,合并到 Ai所指兄弟结点中(若没有右兄弟,则合并至左兄弟结点中)。
下面,我们给出删除叶子结点的三种情况: 
第一种:关键字的数不小于(上取整)[m/2],如下图删除关键字:12 
è¿éåå¾çæè¿°

删除12后的结果如下,只是简单的删除关键字12和其对应的指针。 
这里写图片描述

第二种:关键字个数n等于( 上取整)[ m/2 ]-1,而且该结点相邻的右兄弟(或左兄弟)结点中的关键字数目大于( 上取整)[m/2]-1。 
这里写图片描述

如上图,所示,我们需要删除50这个关键字,所以我们需要把50的右兄弟中最小的关键字:61上移到其父结点,然后替换小于61的关键字53的位置,53则放至50的结点中。然后,我们可以得到如下的结果: 
这里写图片描述

第三种:关键字个数n等于( 上取整)[ m/2 ]-1,而且被删关键字所在结点和其相邻的兄弟结点中的关键字数目均等于(上取整)[m/2]-1

这里写图片描述

如上图所示,我们需要删除53,那么我们就要把53所在的结点其他关键字(这里没有其他关键字了)和父亲结点的61这个关键字一起合并到70这个关键字所占的结点。得到如下所示的结果: 
这里写图片描述

 

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值