从千万级数据查询浅谈MySQL索引结构和原理

最新推荐文章于 2022-09-29 01:17:41 发布

无雨年华

最新推荐文章于 2022-09-29 01:17:41 发布

阅读量466

点赞数

分类专栏： JAVA 文章标签： mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gzheclipse/article/details/106199812

版权

本文通过一个千万级数据查询的实例，探讨了MySQL索引的重要性和工作原理，包括二叉树、红黑树、BTree和B+Tree的特性。重点分析了B+Tree在MySQL中的应用，解释了InnoDB存储引擎为何需要主键，特别是整型自增主键的优势。此外，还讨论了MyISAM和InnoDB的区别以及MySQL默认页大小为16KB的原因。

摘要由CSDN通过智能技术生成

慢SQL问题相信大部分开发都遇到过，对于这样的问题通常第一反应就是看看sql是否合理，比如：

避免使用IN和NOT IN，否则可能会导致全表扫描
避免在where子句中对字段进行函数操作
避免在where子句中对字段进行左模糊查询
避免在where子句中对字段进行OR连接
避免SELECT *
...

除此之外，还有一种常见的反应就是这个表有没有加索引？绝大部分情况下，加了个索引基本上就搞定了。

首先就来构造一个千万级的表直观感受下。创建一张user表，然后新增1000万条数据，查询一下：

用了近30秒的时间，这还是单表查询，关联查询明显会更慢。接下来，将id设为索引，再来验证：

从30s到0.02s，提升了足足1500倍。为什么加了索引之后，速度一飞冲天了呢？下面从索引结构和MySQL原理两个方面入手。

一、索引数据结构

先来看下 MySQL官方对索引的定义：

索引（Index）是帮助MySQL高效获取数据的数据结构。

这里面有两个关键词：高效获取、数据结构。对于数据库来说，查询是最主要的使用功能，查询速度肯定是越快越好。最基本的查找是顺序查找，更高效的查找很自然会想到二叉树、红黑树、Hash表、BTree等。

1.1 二叉树

特点：

左边节点的键值小于根的键值
右边节点的键值大于根的键值。

如图1，它确实能明显提高搜索性能，但如果用来作为数据库的索引，明显存在很大的缺陷。对于图2这种递增的id，存储后索引近似于变成了单边的链表，显然是不合适的。

图1

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从千万级数据查询浅谈MySQL索引结构和原理

慢SQL问题相信大部分开发都遇到过，对于这样的问题通常第一反应就是看看sql是否合理，比如：避免使用IN和NOT IN，否则可能会导致全表扫描避免在where子句中对字段进行函数操作避免在where子句中对字段进行左模糊查询避免在where子句中对字段进行OR连接避免SELECT * ...除此之外，还有一种常见的反应就是这个表有没有加索引？绝大部分情况下，加了个索引基本上就搞定了。首先就来构造一个千万级的表直观感受下。创建一张user表，然后新增1000万条数据，查询一下：
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。