B+树，B*树，与MySQL数据库的索引

最新推荐文章于 2024-07-23 21:20:32 发布

_ 菜 -∞

最新推荐文章于 2024-07-23 21:20:32 发布

阅读量150

点赞数 2

分类专栏：数据库文章标签：数据库 B+Tree 聚簇索引辅助索引

本文链接：https://blog.csdn.net/duchenlong/article/details/108697563

版权

数据库专栏收录该内容

7 篇文章 0 订阅

订阅专栏

B+树，B*树，与数据库的存储引擎

前言
B+ 树
B* 树
MySQL数据库的索引
- B-Tree索引
- InnoDB 存储引擎中的聚簇索引与辅助索引

前言

接上一篇B树的解释 https://blog.csdn.net/duchenlong/article/details/108484464

B树的特点

根节点至少有两个孩子
每个非根节点至少有M/2(上取整)个孩子,至多有M个孩子
每个非根节点至少有M/2-1(上取整)个关键字,至多有M-1个关键字，并且以升序排列
key[i]和key[i+1]之间的孩子节点的值介于key[i]、key[i+1]之间
所有的叶子节点都在同一层

在这里插入图片描述

B+ 树

通过B树，我们可以极大程度上减少在查找元素时对存储位置的访问次数(内存，磁盘)，但是如果我们想要按照顺序输出所有的数据时，在B树中可以采用中序遍历的方式。

也就是以左-根-右的方式进行遍历，时间主要都花费在递归调用栈帧中了。
在这里插入图片描述
但是在B+树中，为了解决遍历速度的问题，将所有的数据都在叶子节点中存放，每个叶子节点之间以链表的形式再连接起来。这样当需要查找一定范围的数据时，只需要找到第一个开始的数据，就可以按照链表的形式进行遍历，减少递归对栈帧的调用。
在这里插入图片描述
B+树的特点：

对于B+树的每一个结点，键值和子树的个数是相同的，k个键值就有k个对应区间的子树。只有叶子节点保存数据，对于非叶子的节点，只进行索引而不保存数据
所有的叶子结点中包含了全部元素的信息，及指向含这些元素记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。
所有的中间节点元素都同时存在于子节点，在子节点元素中是最大（或最小）元素。

总结：

B+树的层级更少：相较于B树，B+每个非叶子节点存储的关键字数更多，树的层级更少所以查询数据更快；
B+树查询速度更稳定：B+树所有关键字数据地址都存在叶子节点上，所以每次查找的次数都相同所以查询速度要比B树更稳定;
B+树天然具备排序功能：B+树所有的叶子节点数据构成了一个有序链表，在查询大小区间的数据时候更方便，数据紧密性很高，缓存的命中率也会比B树高。
B+树全节点遍历更快：B+树遍历整棵树只需要遍历所有的叶子节点即可，而不需要像B树一样需要对每一层进行遍历，这有利于数据库做全表扫描。

所以说，相比B树而言，B+树因为这些特性，更适合文件系统一些

B* 树

B* 树是B+树的一种变形，在B+树叶子节点都是相连的基础上，为同一层的非叶子节点之间也进行了连接
在这里插入图片描述

其次，B*树在进行分裂的时候，对于最少关键字的个数进行了限制，B+树是最少(1/2) * M个关键字，而 B * 树最少则是(2/3) * M个关键字，也就是块的最低使用率为2/3（代替B+树的1/2），提高了空间利用率。

B+树的分裂：

当一个节点数据满了的时候，重新开辟一个节点，将原节点中1/2的数据复制到新的节点中，再在父节点中增加新的节点指针。

B*树的分裂：

当一个节点数据满了的时候，如果它的下一个兄弟节点没有满，那么就可以分一部分数据到兄弟节点中，再在原节点中插入待插入的数据。最后因为此时父节点中的兄弟节点表示数据的范围发生了改变，就需要修改一下他们的范围；

如果兄弟节点也满了，则进行增加新结点的操作，复制原节点中1/3的数据到新结点中，在父节点增加新结点的指针。

二者相比，B* 树在分配新结点方面的概率比B+树要低，增加了空间使用率。

总结

数据结构	特点
B树	多路搜索树，每个节点存储[M/2,M]个关键字，非叶子节点存储指向关键字范围的子节点；所有关键字在整棵树中都可以出现
B+树	为每个叶子节点增加了一个链表指针，方便区间搜索；所有的关键字都在叶子节点中存储，非叶子节点只提供数据的索引信息
B* 树	在B+树的基础上，为每个非叶子节点增加了链表指针；将节点的空间利用率从1/2变成了2/3

MySQL数据库的索引

在这里插入图片描述

索引有很多类型，比如说B树，哈希表等，可以为不同的场景提供合适的服务。

在MySQL中，索引是在存储引擎层中实现的，而不是在服务器中。对于不同的存储引擎，他的索引方式并不相同，不是所有的存储引擎都支持所有类型的索引。

B-Tree索引

一般来说，B-Tree索引就是数据库底层默认的索引类型，他使用B-Tree的数据结构来存储数据
NDB集群存储引擎内部使用的是B-Tree结构，而InnoDB则使用的是B+Tree

而存储引擎以不同的方式使用B+Tree索引，性能也各有不同。MyISAM存储引擎 （不支持事务） 则使用前缀压缩技术使得索引更小，使用数据的物理位置引用被索引的行，但是InnoDB （支持事务） 则按照原数据格式进行存储，根据主键引用被索引的行

索引是基于表的，而不是基于数据库的

InnoDB 存储引擎中的聚簇索引与辅助索引

对于InnoDB存储引擎来说，当我们创建一个MySQL的表时

create table stu 
(
	id int primary key,
	name varchar(20)
);

我们进行查找，会有两种情况，第一种是根据主键(id)进行查找，另一种是对于非主键(name)进行查找。而如果没有显式指定主键，则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键，如果不存在这种列，则MySQL自动为InnoDB表生成一个隐含字段作为主键，这个字段长度为6个字节，类型为长整形

主键查找
直接使用B+树的特性进行查找，因为在建表时，默认的底底层索引类型为B+Tree，他是以主键为key进行建立的，主键具有唯一性。
叶子节点包含了完整的数据记录，这种索引叫做聚集索引。因为InnoDB的数据文件本身要按主键聚集，所以InnoDB要求表必须有主键
非主键查找
而非主键的查找方式，则是利用B+Tree的数据都在叶子节点中，并且是按照升序排列的，先查找到第一条数据，然后对所有的数据进行遍历得到需要查找的结果，时间复杂度为O(n)。
InnoDB的辅助索引data域存储相应记录主键的值而不是地址，所有辅助索引都引用主键作为data域。