对MySQL底层索引深度解析

本文深入探讨了数据库索引的常见模型,包括哈希表、二叉树、平衡二叉树(AVL树)、B树和B+树。分析了各种模型的优缺点,特别强调了B+树在数据库索引中的优势,因为它能够减少磁盘IO次数,支持高效范围查询。文章以MySQL的InnoDB存储引擎为例,详细解析了InnoDB的B+树索引结构,包括数据页、页目录等概念,并讨论了索引查询的性能影响因素。
摘要由CSDN通过智能技术生成

为什么需要索引?
一句话概括:索引的出现其实就是为了提高数据查询的效率。

一、索引常见模型

模型: 哈希表、有序数组和搜索树

哈希表

  • 哈希表是一种以键 - 值(key-value)存储数据的结构,我们只要输入待查找的键即 key,就可以找到其对应的值即 Value。哈希的思路很简单,把值放在数组里,用一个哈希函数把 key 换算成一个确定的位置,然后把 value 放在数组的这个位置。
    时间复杂度:0(1)
  • 画重点:如果索引的值有重复的话,会发生hash碰撞,虽然可以解决hash冲突,但是导致查询效率降低。
  • 场景: 哈希表这种结构适用于只有等值查询的场景,不适用于查找范围的。类似 redis Memcached 及其他一些 NoSQL 引擎。

搜索树

在了解搜索树之前我们需要先知道 二叉树、平衡二叉树、B树、B+树

推荐一个工具可以清晰的理解树的原理: https://www.cs.usfca.edu/~gal...

二叉树

二叉树特性: 左子树的键值小于根的键值,右子树的键值大于根的键值。

如下图就是一个二叉树

当前二叉树的插入顺序是: 3 2 4 1 5

如果我们按1 2 3 4 5 的顺序来插入的化, 我们得到的二叉树就是如下图所示


如果是这种二叉树查询效率就太低了。若想二叉树的查询效率尽可能高,需要二叉树是平衡的从而引出新的定义 - 平衡二叉树或称AVL树。

平衡二叉树

平衡二叉树特点:

  • 满足二叉树的特性
  • 任何节点的两个子树的高度最大差为1

如上两个组合之后就是平衡二叉树,如下图

中插入树的顺序为:1 2 3 4 5 6 7 8 时候生成的是如图所示的内容,和图二完成不一样, 在通过工具生成这个图的时候明显可以看到不管如何插入节点数据都能满足平衡二叉树的特点2。

当删除一个节点之后同样能满足avl树,如下图删除图3中的5节点之后展示如下。

总结一下 平衡二叉树的优点

  • a 不错的查找性能(O(logn)), 不存在极端的低效查找的情况。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值