Mysql索引底层数据结构之B树

Mysql索引底层数据结构(B树)

一.什么是B树

        B - Trees是一种平衡的多叉树,称为B树(或B-树、B_树),也是数据结构中树形结构的一种。

二.什么是索引,为什么要用要索引

        索引是帮助Mysql高效获取数据的排好序数据结构,用于快速找出在某个列中有一特定值的行。

        假如数据库有一张表(user)他的字段有col1和col2,我们的表是在我们的磁盘上,如果语句写成select * from user where col1 = 6; 他就会从第一行开始,把磁盘上每一行数据都读取出来,直到查找到col1 = 6的数据,我们如果不进行任何辅助手段帮助查询的话,那么我们查找到这一行数据要进行6次的磁盘I/O。如果我们表的数据是百万级别的,而且数据恰好位于表的底层呢?那要经过多少次的磁盘I/O,效率自然会非常低。 如果没有加索引,查询的数据时就很可能会进行全表扫描。

三.Mysql中索引用到的数据结构

        上节说到,索引是排好序的数据结构,那么它用到了哪种数据结构?
        如果学过数据结构的朋友估计对二叉树肯定不陌生,二叉树虽然能够解决查询的次数问题,但二叉树一个节点的容量只能存一个索引,查找一个位与整个树底端的数据所用到的次数就会随着整个树的高度增加。那我们如果不想让整个树的高度变得不可控,就可以在横向扩容,设置一个节点的容量,让其能够存储多个索引,那么就引出了B树。
B - Trees:

  • 一个节点上存储了多个索引元素
  • 节点中数据索引从左到右递增排列
  • 叶节点的指针为空

B - Trees

四.Mysql并不是完全使用了B树

Mysql其实对B树做了些改造,真正的Mysql底层实际上所用到的是B+树(B + Trees)
B + Trees(B - Trees变种):

  • 非叶子节点不存储data,只存储索引
  • 叶子节点不存储指针
  • 顺序访问指针,提高区间访问性能

在这里插入图片描述

五.B + Trees插入过程

        第三节说到B树是对二叉树做了横向上的扩容,会设置一个容量,那么如果要将数据1,2,3,4,5,6,7依次放入最大容量为3的B+树中,它会怎样进行插入。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
        经过上图可以看出B+树的插入是才横向上做文章,一个节点最大容量为3(不能大于等于3),当一个节点的数据容量为3时,它会进行分裂,让其不能大于等于3。
每个节点递增叶子节点依次递增

        他也符合二叉树的特性,相邻的两个树叉,右边的子元素总是大于等于它的父元素,左边的子元素总是小于它的父元素。
在这里插入图片描述

六.使用B+树对数据查询

        不知道大家有没有注意到上图中叶子节点包含我们的所有数据,其实叶子节点是有一种完整的索引元素。非叶子节点把一些中间的元素提取出来做冗余,放到非叶子节点。

        类似一些折半查找,都会把处于中间的元素提取出来做冗余,查找就会更快。

一般Mysql会把根节点的所有元素放在内存,不需要从磁盘上查找

比如:要查找的数据为30,30从内存中定位(大于15,小于56),指针经过一次磁盘I/O定位到下一个节点,30继续定位(大于20,小于49),指针进行第二次磁盘I/O定位到30所在节点,总共只进行了两次磁盘I/O,那么它的读取速率是非常快的。
在这里插入图片描述

最后给大家推荐一个学习数据结构的网址:https://www.cs.usfca.edu/~galles/visualization/Algorithms.html
  • 5
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值