MySQL索引底层数据结构

本文深入探讨了MySQL查询过程中CPU如何利用索引优化I/O操作,介绍了索引的本质和作用。详细讲解了MySQL底层数据结构B+Tree,对比了B+Tree与B-Tree的区别,并解释了MySQL为何选择B+Tree。还讨论了不同存储引擎如MyISAM和InnoDB的索引实现方式,以及主键和自增主键的重要性。最后提到了复合索引的创建和最佳左前缀特性,以提高查询效率。
摘要由CSDN通过智能技术生成

1.MYSQL语句查询表中数据这一过程,CPU到底做了什么?

答:数据记录存储于表中,实际上是存储在磁盘上,每一次查询表的操作其实就是CPU对磁盘的I/O操作(寻道时间长,速度慢,旋转时间短,速度快),索引的本质就在于CPU不用在所有记录中去查找你所需要的那条或那部分记录(全表检索),根据索引文件就能找到那条记录或者那条记录的地址,从而获取到数据。

2.索引是什么?

答:索引是帮助MYSQL高效获取数据的排好序的数据结构。它存储在文件中。

3.MySQL索引底层是什么数据结构?为什么不是哈希表或者二叉树?

答:MySQL索引底层数据结构是B+Tree,哈希表可以经过一次哈希算法查找到所需记录,但是哈希表不能排序,且要考虑哈希碰撞的问题,二叉树插入顺序一定情况下,可能出现单边增长的情况,即使不是单边增长,或者用红黑树,平衡树,当数据记录高达几百万,几千万乃至上亿条数据记录时,树的高度也会非常高,从而导致CPU与磁盘的I/O次数大幅度增加,查询时间很长,从效率的角度来说,达不到我们的预期要求,而B+Tree不一样,它在树的基础上增加了一个度的概念(每一个树节点横向存储的索引个数),及在每一个树节点上横向顺序扩展,每一次I/O获取那一个树的节点的所有索引数据,在内存中再进行比较查找(相比于I/O获取,在内存的索引数据比较查询的开支可以忽略不计),从而达到仅仅只进行数次(一般3-5次)的I/O查找就能找到记录。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MySQL 索引底层数据结构主要有 B-Tree 和 Hash 结构两大类。 ### B-Tree B-Tree 是一种自平衡的树形数据结构,主要用于数据库和其他需要快速查找、插入和删除操作的数据存储系统中。它有以下几个关键特征: 1. **节点层次**:每个节点可以有多个子节点,并允许包含多个键值对,使得数据可以在树的较高层存储,提高查询效率。 2. **最大值限制**:节点中包含的最大键的数量是由节点的最大度数(分支因子)决定的。这意味着在同一级的节点之间存在某种形式的均匀分布。 3. **排序**:所有键都按升序排列,同时其左右子节点分别存储比当前节点小和大的键值部分。 4. **平衡**:通过调整内部结点的高度,保持整棵树的平衡状态,确保所有的路径长度大致相等。 ### Hash 结构 Hash 结构用于快速定位特定键对应的值。其核心在于利用哈希函数将键转换成一个哈希码,然后用这个哈希码作为索引来直接访问存储位置。 1. **哈希表**:基本的 hash 数据结构就是一个数组,每个元素对应着一个桶。当插入新元素时,使用哈希函数计算出该元素应该存放的位置,即哈希码对应的数组下标。 2. **冲突解决**:由于不同的键可能会得到相同的哈希码,因此需要策略处理这种冲突情况,常见的解决办法包括线性探测、链地址法和二次探查等。 3. **动态调整**:为了维持性能,哈希表通常会通过调整大小或重新哈希函数等方式来应对负载增加的情况。 ### MySQL 中的索引应用 MySQL 使用 B-Tree 结构来构建其默认类型的索引(如BTREE),这使得索引具有高效搜索、插入和删除的特点。对于 Hash 索引,则在某些场景下提供更快的查找速度,尤其是在单个列上使用并且数据集不是非常庞大时。 了解索引底层数据结构有助于优化查询性能,合理设计数据库结构和查询语句,以及更好地理解和管理数据库的运行状况。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值