B+树索引

最新推荐文章于 2024-07-26 12:52:45 发布

Holly_www

最新推荐文章于 2024-07-26 12:52:45 发布

阅读量169

点赞数 1

分类专栏：数据库文章标签：索引 B+树数据库

本文链接：https://blog.csdn.net/Holly_www/article/details/94720635

版权

数据库专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

数据库系统中文件索引的工作方式非常类似于书本的索引。假如我们要检索一条记录，数据库首先会查找索引，找到记录所在的磁盘块，然后取出该磁盘块，得到所需的记录。
$B^+$ 树索引采用平衡数（Balance tree）结构，树根到树叶的每条路径的长度都相同。并且在数据插入和删除的情况下仍能保持查询执行效率，是使用最广泛的索引结构之一。

$B^+$ 树结构（无重复搜索码值¹）

下图是一个典型的 $B^+$ 树的结点，它最多包含 n-1 个搜索码值 $K_1,...,K_{n-1}$ ，搜索码值是按照一定的顺序排列的（ $K_i < K_j, i < j$ ），以及 n 个指针 $P_1,...,P_n$ ，指针的作用会在下面解释。
典型的B+树结点
n 对于特定的 $B^+$ 树是固定的，并且还要满足以下条件：

叶子结点 的 搜索码值 数量至少为 $\lceil(n-1)/2\rceil$ ，至多为 $n - 1$
非叶结点 的指针数量至少为 $\lceil n/2\rceil$ ，至多为 $n$
根结点 必须至少包含两个指针，除非整棵树只有一个结点

以下是 $B^+$ 树实例（n = 4），每一个结点的小方框是指针，大方框存搜索码值。
在这里插入图片描述
对于每个结点

叶子结点的搜索码值数量至少为 $\lceil(n-1)/2\rceil=2$ ，至多为 $n - 1 = 3$
非叶结点的指针数量至少为 $\lceil n/2\rceil=2$ ，至多为 $n = 4$
根结点至少包含两个指针

指针的作用

对于叶子结点， $P_i$ （i < n）指向的是 $K_i$ 的具体文件记录。例子中第三层的 $P_1$ 指向的就是 $K_1$ 的详细信息。而叶子结点的最后一个结点 $P_n$ 指向下一个叶子结点，将叶子结点按搜索码的顺序串在一起。（这里的搜索码顺序是字母表顺序）文件所有的搜索码值都要存在于叶子结点中。
对于非叶结点， $P_i$ 指向的是搜索码值大于等于 $K_{i-1}$ ，小于 $K_i$ 的子树。例子中第二层的 $P_2$ 指向的就是这一子树，其搜索码值大于等于Einstein 小于Gold。

$B^+$ 树查询（无重复搜索码值）

从树的根结点开始，向下周游树直到它到达包含指定搜索码值的叶结点。
find()函数伪代码：

function find(value V)
	/*假设没有重复码，返回叶子结点C和索引i使得C.Pi指向搜索码值等于V的记录*/
	置 C = 根节点
	while C 不是叶子节点 {
		令 i = 满足 V <= C.K_i 的最小值
		if 没有这样的 i {
			令 P_m = 结点中最后一个非空指针
			置 C = C.P_m
		}else if (V = C.K_i){
			置 C = C.P_i+1
		}else{
			置 C = C.P_i
		}
	}

	设 i 是满足 K_i = V 的最小值
	if 有这样的 i 存在{
		return (C, i)
	}else{
		return null
	}

* $B^+$ 树（有重复搜索码）

对于叶结点和内部结点中重复的的搜索码值，如果 $i < j$ ，则 $K_i \le K_j$ ，对于非叶结点， $P_i$ 指向的是搜索码值大于等于 $K_{i-1}$ ，小于等于 $K_i$ 的子树。
因此，在查询的过程中，即使在 $V = C.K_i$ 的情况下，也要置 $C = C.P_i$ 。而且，由此到达的叶子结点 $C$ 可能仅包含小于 V 的搜索码，因此，必须还要置 $C = C$ 的右兄弟，并且再次检查 $C$ 是否包含 V。

用于在文件中查找记录的属性或属性集叫搜索码。eg，按照书名来找一本书，书名这一属性即为搜索码。而搜索码值就是搜索码的具体值，这里的例子就可以是具体的书名比如《数据库系统原理》。 ↩︎

Holly_www

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
B+树索引

前言数据库系统中文件索引的工作方式非常类似于书本的索引。假如我们要检索一条记录，数据库首先会查找索引，找到记录所在的磁盘块，然后取出该磁盘块，得到所需的记录。 B+B^+B+树索引采用平衡数（Balance tree）结构，树根到树叶的每条路径的长度都相同。并且在数据插入和删除的情况下仍能保持查询执行效率，是使用最广泛的索引结构之一。B+B^+B+树结构（无重复搜索码值1）下图是...
复制链接

扫一扫