B-树(也叫B树)概念:一棵m阶B树(balanced tree of order m)是一棵平衡的m路搜索树
特点:
1、根结点至少有两个子女;
2、每个非根节点所包含的关键字个数 j 满足:┌m/2┐ - 1 <= j <= m - 1;
3、除根结点以外的所有结点(不包括叶子结点)的度数正好是关键字总数加1,故内部子树个数 k 满足:┌m/2┐ <= k <= m ;
4、所有的叶子结点都位于同一层。
B树的插入及删除操作:
例如:用1, 5, 7, 6, 11, 21, 32, 45, 20, 16, 17, 9, 18, 25, 19, 8, 3, 2, 14, 22构建5阶B树。
B+树概念:一棵m阶B+树(balanced tree of order m)是一棵平衡的m路搜索树
特点:1.根结点至少有两个子女。
2.每个中间节点都至少包含ceil(m / 2)个孩子,最多有m个孩子。
3.每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m。
4.所有的叶子结点都位于同一层。
5.每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。
B+树的插入,删除操作
B+树相较于B树的区别:查询性能更好,B+树查询元素时,自顶行下逐层查找,中间节点没有数据,只存索引,所以同样大小的磁盘页可以容纳更大的节点元素,减少磁盘访问次数。另外,B+树叶子节点用有序双向链表结构,十分适合范围查找,只要找到范围最小值的位置,依次遍历即可。(这也是为什么MySQL数据库选择B+树存储数据而不是B树的原因)
下面来看看B+树相较于B树查询的优势:
由图可以看出B+树的搜索效率更高。
B树:就是在B+树的基础上在非根非叶子节点上再增加指向兄弟节点指针。B树定义了非叶子节点关键字至少为(2/3)m,块的最低利用率为2/3(代替B+树的1/2)。
既然B树可以节省空间,那为什么不用它来存储呢?那是因为B*树分配新节点的概率比B+树低。