本文将探讨以下几个问题。
一、思考
问题一:B树和B+树的区别?
问题二:为什么InnoDB要采用B+树数据结构?
二、分析
-
B树的结构
本文大量参考了其他比较优秀的博文,具体地址,请看文末。
B即balance,意为平衡,B树又称为多路平衡查找树,也称B-树。多路即允许每个节点有多个子节点,称为阶。当阶数为2时,又称为平衡二叉查找树。
M阶B树的定义:
- 每个节点至多有M个子节点。
- 根节点至少有两个子节点(根节点有子节点前提下)。
- 除根节点之外的非叶子节点的子节点数至少为M/2。
- 每个节点存放至少(M/2)-1个关键字,至多M-1个关键字(B树每个节点可以存储多个关键字,请看下文),最少2个。
- 非叶子节点的关键字个数=指向子节点的指针数-1。
- 非叶子节点的关键字升序排列。即K1,K2,....KM-1,且Ki<Ki+1。
- 非叶子节点指针:P1,P2....PM,P1指向关键字小于K1的节点,PM指向关键字大于KM-1的节点,其余指针指向关键字位于P1和PM之间的节点。
- 所有叶子节点位于同一层。
通过定义,我们可以描绘出以下B树(3阶)结构: