索引结构B+树

m阶B树具有如下特征:

1.根结点至少有两个子女。

2.每个中间节点都至少包含ceil(m / 2)个孩子,最多有m个孩子。

3.每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m。

4.所有的叶子结点都位于同一层。

5.每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。
在这里插入图片描述

B+树与B树的区别

有k个子结点的结点必然有k个关键码(有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点)
非叶结点仅具有索引作用,跟记录有关的信息均存放在叶结点中。
树的所有叶结点构成一个有序链表可以按照关键码排序的次序遍历全部记录
所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素

B+树结构

在这里插入图片描述
可以直观地看出节点之间含有重复元素,叶子节点还用指针连在了一起,每个父节点中的元素都出现在了子节点中,是子节点中的最大(或最小)元素
在这里插入图片描述
如上图,根节点中元素8是子节点2,5,8的最大元素,也是叶子节点6,8的最大元素,根节点元素15是子节点11,15的最大元素,也是叶子节点13,15的最大元素。需要注意的是,根节点的最大元素(此处是15)等同于整个B+树的最大元素。无论插入或删除多少元素,始终要保持最大元素在根节点当中。至于叶子节点,由于父节点的元素都出现在了子节点,所以叶子节点包含了全部元素信息。并且每个叶子节点都带有指向下一个节点的指针,形成了一个有序链表。

在这里插入图片描述

B树的卫星数据

在B树中,无论中间节点还是叶子节点都带有卫星数据。
在这里插入图片描述

B+树的卫星数据

B+树还有一个至关重要的特点,那就是”卫星数据“的位置,所谓”卫星数据“,指的是**索引元素所指向的数据记录(比如数据库中的某一行)**而在B+树中,只有叶子节点带有卫星数据,其余中间节点仅仅是索引,没有任何数据关联
在这里插入图片描述
补充一点:在数据库的聚集索引中,叶子节点直接包含卫星数据,在非聚集索引中,叶子节点带有指向卫星数据的指针。

B+树被设计如此,优势主要体现在查询性能上,下面分别通过单元素查询和范围查询举例分析。

单元素查询的时候,B+树会自顶向下逐层查找节点,最终找到匹配的叶子节点,比如我们查找元素3:

  1. 第一次IO
    在这里插入图片描述
  2. 第二次IO
    在这里插入图片描述
  3. 第三次IO
    在这里插入图片描述
    查询过程看上去跟B树差不多,但还是有两点不同的,首先,B+树中间节点没有卫星数据,只存索引数据,所以同样大小的磁盘页可以容纳更多的节点元素,这就意味着,数据量相同的情况下B+树比B树更加的”矮胖“相应会减小IO次数。其次,B+树的查询必须最终查找到叶子节点,而B树只要找到匹配元素即可,无论匹配元素处于中间节点还是叶子节点

因此,B树的查找性能并不稳定,最好的情况是只查根节点即可,最坏的情况是要查到叶子节点,而B+树每一次查找都是稳定的。

范围查询

B树如何做范围查询B树只能依靠中序遍历,以查询3到11范围的元素为例
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
B+树遍历3-11
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如此看来B+树的链表遍历要比B树的中序遍历简单很多的
综合起来,B+树比B树的优势有三个:

1、单一节点存储更多的元素,使得查询的IO次数减少;

2、所有查询都要查找到叶子节点,查询性能稳定;

3、所有叶子节点形成有序链表,便于范围查询。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值