定义
- B树(多路平衡查找树):
B树中所有结点的孩子个数的最大值称为B树的阶,一棵m阶B树或为空树。
一棵m阶的B树需满足以下条件:
- 树中每个结点之多有m棵子树,即至多有m-1个关键字
- 若根结点不是终端结点,则至少有两棵子树。
- 除根结点外的所有非叶结点至少有(m/2)棵子树,即至少含有(m/2)-1个 关键字。(5阶的B树非叶结点,结点内关键字的个数为[ 2 , 4 ]个)
- 所有的叶子结点都出现在同一层次上,并且不带信息(称为失败结点,或者null结点)。
- B+树:
一棵m阶的B+树需满足以下条件:
- 每个分支结点最多有m棵子树(孩子结点)。
- 非叶根结点至少有两棵子树,其他每个分支结点至少有[m/2]棵子树。
- 结点的子树个数与关键字个数相等。
- 所有叶结点包含全部关键字及指向相应记录的指针,叶结点中将关键字按大小顺序排序,并且相邻叶结点按大小顺序相互链接起来。
- 所有分支结点中仅包含它的各个子结点中关键字的最大值及指向其子结点的指针。
区别
- m阶B+树:
- 结点中的n个关键字对应n棵子树。
- 根结点的关键字数为[1,m],其他结点的关键字数为[[m/2],m]。
- 叶结点包含全部的关键字,非叶结点中出现过的关键字也会出现在叶结点中。
- 叶结点包含信息,所有非叶结点仅起到索引作用,非叶结点中的每个索引项只含有对应子树的最大关键字和指向该子树的指针,不含有该关键字对应记录的存储地址。
- m阶B树:
- 结点中的n个关键字对应n+1棵子树。
- 根结点的关键字数为[1,m-1],其他结点的关键字数为[[m/2]-1,m-1]。
- 各结点中包含的关键字是不会重复。
- 所有结点中都包含了关键字对应的记录的存储地址。
优缺点
- B+树优点
- 单一结点存储更多的元素,使得查询的IO次数更少(B+ 树的非叶子结点不存放实际的记录数据,仅存放索引,因此数据量相同的情况下,相比存储即存索引又存记录的 B 树可以存放更多元素)。
- 所有查询都要查询到叶子结点,查询性能稳定。
- 所有叶子结点形成有序链表,便于范围查询。
- 插入和删除效率更高(B+ 树有大量的冗余结点)。
- B树的优点
- 对于内部结点的数据,可直接得到,不必根据叶子结点来定位。