Mysql(1)深入理解Mysql索引底层数据结构与算法


首先说一下,这是我写的第一篇关于mysql的文章,如果有任何不对的地方欢迎留言指正。

索引的本质

什么是索引?它有什么作用?

这里先解释一下什么是索引,采用mysql官网的一句话:
索引是帮助MySQL高效获取数据的排好序的数据结构

解释一下:

  1. 排好序:因为mysql底层数据结构使用的B+树,并且对它做了优化,至于为什么要用B+树,下面会解释,它做的优化就是B+树的所有叶子节点都是按照顺序排列的,下面会重点解释。
  2. 数据结构:这个应该不难理解,不管是红黑树还是B+树都是属于数据结构。

为什么要用索引呢?
很简单,使用索引可以大大的增加我们的查询效率。在日常工作当中,增加查询效率使我们第一要考虑的问题。

为什么Mysql使用B+树存储数据呢?

现在MySQL自带的存储引擎是InnoDB,以前可能有人使用过MyISAM,但是不论哪一种,它们底层都是使用的B+树来存储结构的。
看看下面几种数据结构:
在这里我给大家推荐一个很不错的网址,可以学习和查看我们经常会用到的数据结构网址:B+树,二叉树,满二叉树,平衡二叉树,红黑树,排序,队列,栈等可视化在线演示

二叉树

二叉树也称为有序二叉查找树,满足二叉查找树的一般性质,是指一棵空树具有如下性质
1、任意节点左子树不为空,则左子树的值均小于根节点的值;

2、任意节点右子树不为空,则右子树的值均大于于根节点的值;

3、任意节点的左右子树也分别是二叉查找树;

4、没有键值相等的节点;
在这里插入图片描述
上图为一个普通的二叉查找树,按照中序遍历的方式可以从小到大的顺序排序输出:2、3、5、6、7、8。二叉树的查找平均时间复杂度是O(log(n))。
大家看上图,如果我们的根节点选择是最小或者最大的数,那么二叉查找树就完全退化成了线性结构。
还有一种情况就是如果数据量特别大了,有一千万条数据,如果根据二叉树来查找的话,其实还是很慢的

红黑树

红黑树就是平衡二叉树的一种。
在这里插入图片描述
其实红黑树他的深度如果数据量特别庞大的话,和二叉树一样。还是不能提高效率。
还有一个最致命的问题就是,每一个根节点只能有两个叶节点,如果一个根节点可以有多个子节点,那么就可以更快的提升效率,就是接下来说的B
树。

B-Tree

首先理解一下B树的特点

  1. 叶节点具有相同的深度,叶节点的指针为空
  2. 所有索引元素不重复
  3. 节点中的数据索引从左到右递增排列

上面显示的Max. Degree = 4,就是在这个树最上面的根节点有几个,如果是4,则根节点做多只能有四个。
其实从上面图中可以看到,一级和二级都是存储的索引,但是数据在一级和二级但是有存储的,这样的话每一次根据索引查找数据的时候就增加了I/O的次数,他的效率是底的。

B+Tree(B-Tree变种)

非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
叶子节点包含所有索引字段

叶子节点用指针连接,提高区间访问的性能
在这里插入图片描述
在这里可以看到,B+树的数据保存,只有在叶子节点中才会有,而根节点只保存了索引,这样下来,比如说根节点大小是16kb,一个索引大小是4b,如果树结构有三层的话,那么他就可以保存几千万条数据,而这几千万条数据只需要三次就可以查到,并且所有的叶子节点都是从左到右有序排列的。

MyISAM索引文件和数据文件是分离的(非聚集)

在这里插入图片描述
MyISAM被称为是非聚簇索引,到底是为什么呢,
看过mysql数据库文件的人都应该知道,Myisam引擎的话是frm、MYD、MYI。
frm是表结构,MYD是表数据,MYI是表索引,
通过上图可以看到,MyISAM引擎叶子结点最下面是保存的索引的地址,也就是说保存的是真实数据MYD里面的地址。

InnoDB索引实现(聚集)

  1. 表数据文件本身就是按B+Tree组织的一个索引结构文件
  2. 聚集索引-叶节点包含了完整的数据记录

在这里插入图片描述
Innodb存储文件有frm、ibd.
frm还是数据结构,ibd是存储的索引和数据,是以b+树形式存储的。
为什么说是InnoDB是聚簇索引,大家可以看到上图,在叶子节点下面是直接保存索引和数据的,这和MyISAM的区别是很大的。

接下来说说两个问题:

  1. 为什么建议InnoDB表必须建主键,并且推荐使用整型的自增主键?

因为InnoDB默认是将主键作为聚集索引的,这样根据主键查询的时候,就会提高很大的效率,采用自增型主键的原因就是B+树的叶子结点这一件本来就是有序的,这样可以更加提高效率。

  1. 为什么非主键索引结构叶子节点存储的是主键值?
    一致性和节省存储空间。
    说白了就是回表,先根据非主键索引找到主键索引位置,再根据主键索引找到具体的数据。
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值