注:B-树内容,参考博文:https://blog.csdn.net/u010916338/article/details/86134334
转载地址:https://blog.csdn.net/hguisu/article/details/7786014
B+树是顺应文件系统的需求而产生的一种B-树的变形树。一棵m 阶的B+树和m 阶的B-树的差异在于:
(1)有n 棵子树的节点中含有n 个关键码;(注:B+树的关键码和指针数量相同,而B-树的指针比关键码多一个。)
(2)所有的叶子节点中包含了全部关键码的信息,及指向含有这些关键码记录的指针,且叶子结点本身依关键码的大小自小而大的顺序链接。(注:叶子节点连在一起组成了全部数据的集合。)
(3)所有的非叶子节点可以看成是索引部分,节点中仅含有其子树根结点中最大(或最小)关键码。
如图一棵3阶的B+树:
通常在B+树上有两个头指针,一个指向根节点,另一个指向关键字最小的叶子节点。因此可以对B+树进行两种查找运算:一种是从最小关键字起地毯式顺序查找,另一种是从根节点开始,进行逐渐缩小范围查找。
在B+树上进行随机查找、插入和删除的过程基本上与B-树类似。只是在查找时,若非终端结点上的关键码等于给定值,并不终止,而是继续向下直到叶子结点。因此,在B+树,不管查找成功与否,每次查找都是走了一条从根到叶子结点的路径。
综上可得,B+树理论模型如下:现有数组[10 ,15, 21, 37, 44, 51, 59, 63, 72, 85, 91, 97], 按照一定规则将数组切分成块:[10 ,15], [21, 37, 44], [51, 59], [63, 72], [85, 91, 97],然后取每个数组中最大的那个数,组成新的索引数组[15, 44, 59], [72, 97],通过此索引可以大致获取所要查询数据的大致位置,但是比从头到尾遍历已经提升了很多。如果数据量大,提取的索引数组体量也会很庞大,则可以继续向上再抽取索引数组。