数据结构中B树和B+树的区别-CSDN博客

转载链接：https://msd.misuland.com/pd/2884250171976189524

B树和B+树数据结构及使用场景

1.出现的原因

我们已经知道他们两是mysql索引的数据结构，为什么要使用这种数据结构呢？我们知道内存读取效率远远高于磁盘IO的效率，当数据量大而不能完全存放于内存时，只能依靠磁盘了，一次存放于磁盘页中，每个磁盘页对应一个树的节点。也就是说只要我们能减少磁盘IO的次数，那么查询效率就会显著提高。如何减少?

B树就是通过降低树的深度，将二叉树的“瘦高”变成“矮胖”：

1.每个节点存储多个元素。

2.采用多叉树。

2. B树

这里先说下阶和度的区别：

度数：在树中，每个节点的子节点（子树）的个数就称为该节点的度（degree）。

阶数：（Order）阶定义为一个节点的子节点数目的最大值。（自带最大值属性）

m阶的B树的规则：

根节点至少2个子树
每个节点最多有m个子树
每个中间节点都包含k-1个元素和k个孩子，其中ceil（m/2）<=k<=m（ceil向上取最大整数）
每个叶子节点的元素范围:[ceil(m/2)-1,m-1]
所有的叶子节点都在同一层
每个节点中的元素从小到大排列，节点当中k-1个元素正好是k个孩子包含的元素的值域划分
每个节点不仅有索引的值还都保存了卫星数据，B+树不同

卫星数据：指向数据库的记录（如：数据库中的行）类似于指针指向记录

示例：3阶B树（实际有很多节点没有表示出来）

在这里插入图片描述

查询：

上图为例查询5

第一次磁盘ＩＯ：在内存中定位（与17、35比较），比17小，左子树；　　第二次磁盘ＩＯ：在内存中定位（与８、12比较），比８小，左子树；　　第三次磁盘ＩＯ：在内存中定位（与3、5比较），找到5，终止。

整个过程中，我们可以看出：比较的次数并不比二叉查找树少，尤其适当某一节点中的数据很多时，但是磁盘IO的次数却是大大减少。比较是在内存中进行的，相比于磁盘IO的速度，比较的耗时几乎可以忽略。所以当树的高度足够低的话，就可以极大的提高效率。相比之下，节点中的元素多点也没关系，仅仅是多了几次内存交互而已，只要不超过磁盘页的大小即可。