浅谈MySQL索引底层数据结构与算法

工具推荐:数据结构可视化网站:https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

一、何为索引

索引是帮助MySQL高效获取数据的排好序的数据结构

二、什么是聚簇索引,非聚簇索引

聚簇索引:索引文件和数据文件是在一起的–叶子节点包含了所有的记录

非聚簇索引:索引文件和数据文件是分离的

三、索引的数据结构

  • 二叉树
  • 红黑树
  • Hash表
  • B-Tree
image.png

四、B-Tree

  • 叶节点具有相同的深度,叶节点的指针为空
  • 所有索引元素不重复
  • 节点中的数据索引从左到右递增排列
image.png

五、B+Tree

  • 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
  • 叶子节点包含所有索引字段
  • 叶子节点用指针连接,提高区间访问的性能!
image.png

六、B树和B+树的区别

  • B树不管叶子节点还是非叶子节点,都会保存数据,而B+树只会在叶子节点存储数据
  • B树叶子结点的指针是单向的,而B+树是双向的

七、Hash

  • 对索引的key进行一次hash计算就可以定位出数据存储的位置
  • 很多时候Hash索引要比B+ 树索引更高效
  • 仅能满足 “=”,“IN”,不支持范围查询
  • hash冲突问题
image.png

八、MyISAM存储引擎索引实现

  • MyISAM索引文件和数据文件是分离的(非聚簇)
image.png

九、InnoDB存储引擎索引实现(聚簇)

  • 表数据文件本身就是按B+Tree组织的一个索引结构文件
  • 聚集索引-叶节点包含了完整的数据记录
  • 为什么建议InnoDB表必须建主键,并且推荐使用整型的自增主键?
    • 因为如果我们没有自己设立自增主键,那么InnoDB就会自动帮我们选一个列的所有的数据不一样的属性作为主键(组织我们的B+树),如果表中不存在这样的列,那么InnoDB就会帮我们创建一个隐藏列
    • 使用整型的原因是在对比的时候,整型的比较速度更快(1<2),如果使用的是字符串,还要转换为ASCLL码,并且整型的占用空间比较小
    • 使用自增的主键原因是如果不是自增的,容易改变索引的结构,降低效率
  • 为什么非主键索引结构叶子节点存储的是主键值?(一致性和节省存储空间)
image.png image.png

十、索引最左前缀原理

  • 联合索引的底层存储结构长什么样?
image.png

十一、MySQL的底层索引为什么选B+树而不是B树

因为B树不管叶子节点还是非叶子节点,都会保存数据,这样导致在非叶子节点中能保存的指针数量变少(有些资料也称为扇出)

指针少的情况下要保存大量数据,只能增加树的高度,导致IO操作变多,查询性能变低;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值