B+树,B*树,与MySQL数据库的索引

前言

接上一篇B树的解释 https://blog.csdn.net/duchenlong/article/details/108484464

B树的特点

  1. 根节点至少有两个孩子
  2. 每个非根节点至少有M/2(上取整)个孩子,至多有M个孩子
  3. 每个非根节点至少有M/2-1(上取整)个关键字,至多有M-1个关键字,并且以升序排列
  4. key[i]和key[i+1]之间的孩子节点的值介于key[i]、key[i+1]之间
  5. 所有的叶子节点都在同一层

在这里插入图片描述

B+ 树

通过B树,我们可以极大程度上减少在查找元素时对存储位置的访问次数(内存,磁盘),但是如果我们想要按照顺序输出所有的数据时,在B树中可以采用中序遍历的方式。

也就是以左-根-右的方式进行遍历,时间主要都花费在递归调用栈帧中了。
在这里插入图片描述
但是在B+树中,为了解决遍历速度的问题,将所有的数据都在叶子节点中存放,每个叶子节点之间以链表的形式再连接起来。这样当需要查找一定范围的数据时,只需要找到第一个开始的数据,就可以按照链表的形式进行遍历,减少递归对栈帧的调用。
在这里插入图片描述
B+树的特点:

  1. 对于B+树的每一个结点,键值和子树的个数是相同的,k个键值就有k个对应区间的子树。只有叶子节点保存数据,对于非叶子的节点,只进行索引而不保存数据

  2. 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。

  3. 所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。

总结:

  1. B+树的层级更少:相较于B树,B+每个非叶子节点存储的关键字数更多,树的层级更少所以查询数据更快;

  2. B+树查询速度更稳定:B+树所有关键字数据地址都存在叶子节点上,所以每次查找的次数都相同所以查询速度要比B树更稳定;

  3. B+树天然具备排序功能:B+树所有的叶子节点数据构成了一个有序链表,在查询大小区间的数据时候更方便,数据紧密性很高,缓存的命中率也会比B树高。

  4. B+树全节点遍历更快:B+树遍历整棵树只需要遍历所有的叶子节点即可,而不需要像B树一样需要对每一层进行遍历,这有利于数据库做全表扫描。

所以说,相比B树而言,B+树因为这些特性,更适合文件系统一些

B* 树

B* 树是B+树的一种变形,在B+树叶子节点都是相连的基础上,为同一层的非叶子节点之间也进行了连接
在这里插入图片描述

其次,B*树在进行分裂的时候,对于最少关键字的个数进行了限制,B+树是最少(1/2) * M个关键字,而 B * 树最少则是(2/3) * M个关键字,也就是块的最低使用率为2/3(代替B+树的1/2),提高了空间利用率。

B+树的分裂:

当一个节点数据满了的时候,重新开辟一个节点,将原节点中1/2的数据复制到新的节点中,再在父节点中增加新的节点指针。

B*树的分裂:

当一个节点数据满了的时候,如果它的下一个兄弟节点没有满,那么就可以分一部分数据到兄弟节点中,再在原节点中插入待插入的数据。最后因为此时父节点中的兄弟节点表示数据的范围发生了改变,就需要修改一下他们的范围;

如果兄弟节点也满了,则进行增加新结点的操作,复制原节点中1/3的数据到新结点中,在父节点增加新结点的指针。

二者相比,B* 树在分配新结点方面的概率比B+树要低,增加了空间使用率。

总结

数据结构特点
B树多路搜索树,每个节点存储[M/2,M]个关键字,非叶子节点存储指向关键字范围的子节点 ;所有关键字在整棵树中都可以出现
B+树为每个叶子节点增加了一个链表指针,方便区间搜索;所有的关键字都在叶子节点中存储,非叶子节点只提供数据的索引信息
B* 树在B+树的基础上,为每个非叶子节点增加了链表指针;将节点的空间利用率从1/2变成了2/3

MySQL数据库的索引

在这里插入图片描述

索引有很多类型,比如说B树,哈希表等,可以为不同的场景提供合适的服务。

在MySQL中,索引是在存储引擎层中实现的,而不是在服务器中。对于不同的存储引擎,他的索引方式并不相同,不是所有的存储引擎都支持所有类型的索引。

B-Tree索引

一般来说,B-Tree索引就是数据库底层默认的索引类型,他使用B-Tree的数据结构来存储数据
NDB集群存储引擎内部使用的是B-Tree结构,而InnoDB则使用的是B+Tree

而存储引擎以不同的方式使用B+Tree索引,性能也各有不同。MyISAM存储引擎 (不支持事务) 则使用前缀压缩技术使得索引更小,使用数据的物理位置引用被索引的行,但是InnoDB (支持事务) 则按照原数据格式进行存储,根据主键引用被索引的行

索引是基于表的,而不是基于数据库的

InnoDB 存储引擎中的聚簇索引与辅助索引

对于InnoDB存储引擎来说,当我们创建一个MySQL的表时

create table stu 
(
	id int primary key,
	name varchar(20)
);

我们进行查找,会有两种情况,第一种是根据主键(id)进行查找,另一种是对于非主键(name)进行查找。而如果没有显式指定主键,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键,如果不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段作为主键,这个字段长度为6个字节,类型为长整形

  1. 主键查找
    直接使用B+树的特性进行查找,因为在建表时,默认的底底层索引类型为B+Tree,他是以主键为key进行建立的,主键具有唯一性。
    叶子节点包含了完整的数据记录,这种索引叫做聚集索引。因为InnoDB的数据文件本身要按主键聚集,所以InnoDB要求表必须有主键
    在这里插入图片描述

  2. 非主键查找
    而非主键的查找方式,则是利用B+Tree的数据都在叶子节点中,并且是按照升序排列的,先查找到第一条数据,然后对所有的数据进行遍历得到需要查找的结果,时间复杂度为O(n)。
    InnoDB的辅助索引data域存储相应记录主键的值而不是地址,所有辅助索引都引用主键作为data域。
    在这里插入图片描述

如果想要增加非主键查找的速率,那么可以以经常使用的非主键为key,再建立额外的B+Tree辅助索引。辅助索引不能太多,因为当我们更新,插入一则数据的时候,不仅需要在原索引中更新,还需要对辅助索引的数据进行维护,所以辅助索引过多会影响性能。

聚集索引这种实现方式使得按主键的搜索十分高效,但是辅助索引搜索需要检索两遍索引:首先检索辅助索引获得主键,然后用主键到主索引中检索获得记录

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值