B-树,即为B树。因为B树的原英文名称为B-tree,而国内很多人喜欢把B-tree译作B-树,B-tree就是指的B树。
B-树容易让人误解,建议大家用B树称呼, 本文以下直称B树
对概念不理解的可以参考 我的另一篇介绍B树概念和应用的博客:
https://blog.csdn.net/q5706503/article/details/84729768
B树的基本概念
B树中结点允许拥有孩子结点个数的最大值成为B树的阶,通常用m表示,从查找效率考虑,一般要求m>=3。
一棵m阶B树或者是一棵空树,或者是满足以下条件的m叉树:
- 每个节点最多有m个孩子(分支)。
- 而最少分支数要看是否为根结点,如果是根结点且不是叶子结点,则至少要有两个分支,非根非叶结点至少有ceil(m/2)个分支,这里ceil代表向上取整。
- 如果一个结点有n-1个关键字,那么该结点有n个分支。这n-1个关键字按照递增顺序排列。
- 结点内各关键字按从小到大排列。
- 叶子结点处于同一层;可以用空指针表示,是查找失败到达的位置。
每个结点的结构为:
n | k1 | k2 | ... | kn |
---|---|---|---|---|
p0 | p1 | p2 | ... | pn |
其中,n为该结点中关键字的个数;ki为该结点的关键字且满足ki<ki+1;pi为该结点的孩子结点指针且满足pi所指结点上的关键字大于ki且小于ki+1,p0所指结点上的关键字小于k1,pn所指结点上的关键字大于kn。
B-树是平衡m叉查找树,但限制更强,要求所有叶结点都在同一层。
举个例子:
这是一个4阶B树(m=4)
分析解释:
- 结点的分支数等于关键字数+1,最大的分支数就是B树的阶数,因此m阶的B树中结点最多有m个分支,所以可以看到,上面的一棵树是一个4阶B树
- 因为上面是一棵4阶B树,所以非根非叶结点至少要有ceil(4/2)=2个分支。根结点可以不满足这个条件,图中的根结点有两个分支
- 如果