【实战】MySQL百万数据优化

MySQL分页查询优化：理解回表与覆盖索引

最新推荐文章于 2025-05-29 08:45:00 发布

原创最新推荐文章于 2025-05-29 08:45:00 发布 · 1.2k 阅读

1 ·

CC 4.0 BY-SA版权

本来来自公众号-一个程序员的成长

文章标签：

#mysql #数据库

文章探讨了在大数据量下MySQL分页查询的性能问题，特别是LIMIT的使用。通过例子展示了如何因回表操作导致查询性能下降，解释了覆盖索引的概念，并提出了通过创建临时表和JOIN操作来优化查询性能的方法，显著减少了IO操作，提高了查询速度。

业务场景

一般在项目开发中会有很多的统计数据需要进行上报分析，一般在分析过后会在后台展示出来给运营和产品进行「分页查看」，「最常见的一种就是根据日期进行筛选」。这种统计数据随着时间的推移数据量会慢慢的变大，达到百万、千万条数据只是时间问题。

瓶颈再现

创建了一张user表，给create_time字段「添加了索引」。并在该表中添加了100w条数据。

我们这里使用「limit分页」的方式查询下「前5条」数据和「后5条」数据在查询时间上有什么区别。

查询「前10」条基本上不消耗什么时间

我们从第「50w」+开始取数据的时候，查询耗时1秒。

SQL_NO_CACHE
这个关键词是为了不让SQL查询走缓存。

同样的SQL语句，不同的分页条件，两者的性能差距如此之大，那么随着数据量的增长，往后页的查询所耗时间按理会越来越大。

问题分析

回表

我们一般对于查询频率比较高的字段会建立索引。索引会提高我们的查询效率。我们上面的语句使用了「SELECT * FROM user」，但是我们并不是所有的字段都建立了索引。当从「索引文件」中查询到符合条件的数据后，还需要从「数据文件」中查询到没有建立索引的字段。那么这个过程称之为「回表」。