基本概念
为了实现动态多层索引,通常采用 B-树 和 B+树。但是,用于索引的 B-树 存在缺陷,它的所有中间结点均存储的是数据指针(指向包含键值的磁盘文件块的指针),与该键值一起存储在B-树的结点中。这就会导致可以存储在 B-树中的结点树目极大地减少了,从而增加 B-树的层数,进而增加了记录的搜索时间。
B+树通过仅在树的叶子结点中存储数据指针而消除了上述缺陷。因此,B+树的叶结点的结构与 B-树的内部结点的结构完全不同。在这里应该注意,由于数据指针仅存在于叶子结点中,因此叶子结点必须将所有键值及其对应的数据指针存储到磁盘文件块以便访问。此外,叶子结点被链接磁盘的某个位置,以提供对记录的有序访问。因此,叶子结点形成第一级索引,而内部结点形成多层索引的其他层。叶子结点的某些关键字 key 也出现在内部结点中,充当控制搜索记录的媒介。
与 B-树不同,B+树中的结点存在两个阶(order):对于阶 “a” 和 “ b”,一个用于内部结点,另一个用于外部(或叶)结点。
阶为 a 的 B+树内部结点的结构如下:
![](https://i-blog.csdnimg.cn/blog_migrate/6aed30d2de88ec9fe9499c050ab86e78.png)
对于每一个形如:
的内部结点,其中 ,每一个 表示指向子树根结点的指针, 表示关键字值对于每一个内部结点中的关键字值均满足:
对于一个位于 所指向的子树中的结点 而言,满足:
当 时,均有 .
当 时, .
当 时, .
每一个内部结点最多有
a
个指向子树的指针,即c
最大取a
.根结点至少包含两个指向子树的结点指针,即对于根结点而言