Mysql索引底层数据结构

本文介绍了Mysql索引的重要性以及各种底层数据结构,包括二叉树、红黑树、平衡二叉树、Hash表、B-Tree和B+Tree。重点讲述了为何B+Tree成为Mysql的理想选择,因其能降低磁盘I/O、保证查询效率稳定并支持范围查询。
摘要由CSDN通过智能技术生成

Mysql索引底层数据结构

1、为什么要使用索引

在这里插入图片描述

​ mysql的数据都是存在磁盘上的,每次读取数据要经历磁盘I/O。一张数据表创建之后,里面的数据是不同的时间插入的,因此每张表的每一行数据在磁盘上并不一定连续。因此表中的每一行数据的内存地址都是随机的,因此我们要读取上图的col2=23的那一行至少要经历7次磁盘I/O。

也就是说在没有索引的情况下查询数据库大数据量的表,需要遍历整张表,并进行多次I/O。I/O是非常消耗时间的,因此要想快查询数据索引必不可少。

2、什么是索引

mysql官方给的索引定义:索引是帮助MySQL高效获取数据的排好序的数据结构

在这里插入图片描述

​ 如图所示:要查询col2=23的数据,就把col2这个字段做为索引。

​ 假如如图右边的二叉查找树做为索引的数据结构,每个节点存放一个key一个value,key:索引col2的值例如23,value:图左边的磁盘文件地址例如0xD1。

​ 二叉树特点:二叉树是指至多只有两个子节点的树形数据结构,没有父节点的节点称为根节点,二叉树任

MySQL 索引底层数据结构主要有 B-Tree 和 Hash 结构两大类。 ### B-Tree B-Tree 是一种自平衡的树形数据结构,主要用于数据库和其他需要快速查找、插入和删除操作的数据存储系统中。它有以下几个关键特征: 1. **节点层次**:每个节点可以有多个子节点,并允许包含多个键值对,使得数据可以在树的较高层存储,提高查询效率。 2. **最大值限制**:节点中包含的最大键的数量是由节点的最大度数(分支因子)决定的。这意味着在同一级的节点之间存在某种形式的均匀分布。 3. **排序**:所有键都按升序排列,同时其左右子节点分别存储比当前节点小和大的键值部分。 4. **平衡**:通过调整内部结点的高度,保持整棵树的平衡状态,确保所有的路径长度大致相等。 ### Hash 结构 Hash 结构用于快速定位特定键对应的值。其核心在于利用哈希函数将键转换成一个哈希码,然后用这个哈希码作为索引来直接访问存储位置。 1. **哈希表**:基本的 hash 数据结构就是一个数组,每个元素对应着一个桶。当插入元素时,使用哈希函数计算出该元素应该存放的位置,即哈希码对应的数组下标。 2. **冲突解决**:由于不同的键可能会得到相同的哈希码,因此需要策略处理这种冲突情况,常见的解决办法包括线性探测、链地址法和二次探查等。 3. **动态调整**:为了维持性能,哈希表通常会通过调整大小或重哈希函数等方式来应对负载增加的情况。 ### MySQL 中的索引应用 MySQL 使用 B-Tree 结构来构建其默认类型的索引(如BTREE),这使得索引具有高效搜索、插入和删除的特点。对于 Hash 索引,则在某些场景下提供更快的查找速度,尤其是在单个列上使用并且数据集不是非常庞大时。 了解索引底层数据结构有助于优化查询性能,合理设计数据库结构和查询语句,以及更好地理解和管理数据库的运行状况。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值