Mysql索引的实现原理，B+Tree，WAL

raoxiaoya

于 2024-06-26 14:37:09 发布

阅读量672

点赞数 25

分类专栏： # Mysql 文章标签： mysql 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/raoxiaoya/article/details/139988671

版权

Mysql 专栏收录该内容

36 篇文章 1 订阅

订阅专栏

InnoDB 引擎，每一个数据表有两个文件 .frm和.ibd，分别为表结构，数据和索引，数据挂在主索引的叶子节点上，此主索引称为聚簇索引。

MyISAM 引擎，每一个数据表有三个文件.frm和.MYI和.MYD，分别为表结构，索引，数据；也就是说其索引和数据是分开的，索引的叶子节点存储的不是数据而是磁盘地址，称为非聚簇索引。

下面只分析 InnoDB 引擎。

一、为什么是 B+Tree 而不是 B-Tree

B-Tree

B+Tree

他两最大的区别就是 B+Tree 将data部分下沉到了最后一级，即叶子节点。

对于基于磁盘的存储，一般使用对磁盘的IO次数来评判索引结构的优劣，假设操作系统对磁盘的每次IO能读取 4K 数据（块），假设索引结构的每一个节点有16K的固定空间，这个16K称为页，索引以页作为最基本的管理单位，所以每一次读取要4次IO，从节省IO次数的角度讲，如果每个节点上如果能存储更多的key就能减少IO的次数，而B+Tree是将所有的data下放到叶子节点，其他节点全部用来存储key和指针，显然IO效率更高。

一般在数据库系统或文件系统中使用的B+Tree结构都在经典B+Tree的基础上进行了优化，增加了顺序访问指针。在B+Tree的每个叶子节点增加一个指向相邻叶子节点的指针，做这个优化的目的是为了提高区间访问的性能。也就是说，通过这个指针你可以访问到已经排序好的key的列表。

二、InnoDB 引擎读写磁盘的过程

我们经常听人说Mysql对磁盘的写操作是随机寻址的，所以需要WAL组件。但是为什么Mysql对磁盘的写操作是随机寻址的呢？这就需要了解它读写磁盘的过程。

就以InnoDB引擎为例，其索引结构和源数据都存在.ibd文件里，文件是一块大的连续的磁盘空间，收到查询请求后引擎就去读取此文件的主索引，以页(16K)为单位读取，从B+Tree的根节点开始，当然有时候一个节点不止一页，如果没有找到这个key就要接着读，直到找到了data。

从根节点指向一级节点的时候，那么一级节点存在文件中的哪个位置呢，或者说即便你知道了它在文件中的位置，你要怎么读到它呢，我们可以使用相对于文件起始位置的偏移量来读取那一块的数据，或者计算出其在磁盘上的地址，然后直接读取磁盘，所以指向子节点使用的是指针，整个的读取过程是跳跃的随机的。

同样的，在写入的时候，要写入的目标磁盘块的位置也是跳跃的，所以说写操作是随机的寻址，它不是append模式。有时候在写入后现有节点还要调整。

说到底这些节点都还是存在于文件中，文件是一块大的连续的磁盘空间，所以这里的指针应该是相对于文件起始地址的相对地址，而不能是磁盘的绝对地址，否则你一移动文件那岂不都失效了。

在机械硬盘上面，这种随机寻址会严重影响磁盘的IO性能。

三、需要 WAL (Write-Ahead Logging)

既然直接落盘性能堪忧，那就改成异步落盘。基本上所有的数据库都使用WAL模式来解决这个问题，实现方式可能各有不同，但大致思路都是一样的。

一个修写入请求，先写入日志文件，成功之后才写入缓存，然后有后台程序将日志文件的内容落盘。

在写日志文件的时候，使用 append模式，这就是顺序写，要比随机写好很多。

redo log：保证数据一致性。如果Mysql宕机了，重启的时候可以将日志文件中未落盘的数据落盘。

undo log：保证事务的原子性，实现多版本并发控制（MVCC）。它相当于在修改之前做一下备份。

组提交机制：将多个小的事务合并成一组再执行落盘，可以大幅度降低磁盘的 IOPS 消耗。

关注

25
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
Mysql索引的实现原理，B+Tree，WAL

Mysql索引的实现原理，B+Tree，WAL
复制链接

扫一扫

专栏目录

raoxiaoya CSDN认证博客专家 CSDN认证企业博客

码龄8年

751: 原创

2万+: 周排名

1510: 总排名

187万+: 访问

: 等级

1万+: 积分

673: 粉丝

848: 获赞

212: 评论

2472: 收藏

私信

关注

热门文章

分类专栏

Flink 3篇
计算机视觉与OpenCV 2篇
数据库相关 3篇
消息队列 2篇
Redis 25篇
Elasticsearch 7篇
zookeeper 5篇
Mysql 36篇
Hadoop
golang 218篇
Android
智能硬件开发
c-lang 2篇
微服务 10篇
docker 16篇
PHP 240篇
swoole 22篇
Laravel57 50篇
PHP-GUI 3篇
ThinkPHP5 6篇
网络编程 23篇
Linux 50篇
Python 4篇
Java 4篇
杂项 69篇
Nginx 11篇
WEB前端 26篇

最新评论

mobaxterm居然无法使用rz sz命令
raoxiaoya: 哪个命令卡死，我用的好好的啊
golang中的recover无法捕获异常？
raoxiaoya: 就正常捕获就行了撒
CSRF，XSS攻击与预防
raoxiaoya: CSRF的基础就是Cookie暴漏，使用JWT自然就可以避免了
如何分析golang程序的内存使用情况
russle: 请问博主用的go那个版本？ ... 使用top命令查看snippet_mem进程的内存RSS占用为470M。 top -p $(pidof snippet_mem) ... 我本地使用 go1.16.5, 在这个时候该程序占用的是27.8M
golang 导出excel表格的两个包使用对比
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)增加除了各种控件外，文章正文的字数。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。