MySql深度分页查询优化

xiaoshitou_2015

已于 2023-04-07 21:15:17 修改

阅读量752

点赞数 1

文章标签： mysql 数据库

于 2023-04-07 21:04:17 首次发布

本文链接：https://blog.csdn.net/xiaoshitou_2015/article/details/130020138

版权

文章讨论了随着数据量增长，分页查询效率下降的问题，特别是在MySQL数据库中的表现。提出了三种解决方案：1)只返回主键ID以减少数据传输；2)使用主键ID过滤查询，保持稳定性能；3)对于大规模数据，利用ElasticSearch进行快速搜索。强调了主键选择（数值类型利于排序）和索引的重要性。

摘要由CSDN通过智能技术生成

一、问题复现

在实际的软件系统开发过程中，随着使用的用户群体越来越多，表数据也会随着时间的推移，单表的数据量会越来越大。

以订单表为例，假如每天的订单量在 4 万左右，那么一个月的订单量就是 120 多万，一年就是 1400 多万，随着年数的增加和单日下单量的增加，订单表的数据量会越来越庞大，订单数据的查询不会像最初那样简单快速，如果查询关键字段没有走索引，会直接影响到用户体验，甚至会影响到服务是否能正常运行！

下面我以某个电商系统的客户表为例，数据库是 Mysql，数据体量在 100 万以上，详细介绍分页查询下，不同阶段的查询效率情况（订单表的情况也是类似的，只不过它的数据体量比客户表更大）。

下面我们一起来测试一下，每次查询客户表时最多返回 100 条数据，不同的起始下，数据库查询性能的差异。

当起点位置在 0 的时候，仅耗时：18 ms

当起点位置在 1000 的时候，仅耗时：23 ms

当起点位置在 10000 的时候，仅耗时：54 ms

当起点位置在 100000 的时候，仅耗时：268 ms

当起点位置在 500000 的时候，仅耗时：1.16 s

当起点位置在 1000000 的时候，仅耗时：2.35 s

可以非常清晰的看出，随着起点位置越大，分页查询效率成倍的下降，当起点位置在 1000000 以上的时候，对于百万级数据体量的单表，查询耗时基本上以秒为单位。

而事实上，一般查询耗时超过 1 秒的 SQL 都被称为慢 SQL，有的公司运维组要求的可能更加严格，比如小编我所在的公司，如果 SQL 的执行耗时超过 0.2s，也被称为慢 SQL，必须在限定的时间内尽快优化，不然可能会影响服务的正常运行和用户体验。

对于千万级的单表数据查询，小编我刚刚也使用了一下分页查询，起点位置在 10000000，也截图给大家看看，查询耗时结果：39 秒！

当单表数据量到达百万级的时候，查询效率急剧下降，如何优化提升呢？

二、解决方案

下面我们一起来看看具体的解决办法。

2.1、方案一：查询的时候，只返回主键 ID

我们继续回到上文给大家介绍的客户表查询，将select *改成select id，简化返回的字段，我们再来观察一下查询耗时。

当起点位置在 100000 的时候，仅耗时：73 ms

当起点位置在 500000 的时候，仅耗时：274 ms

当起点位置在 1000000 的时候，仅耗时：471 ms

可以很清晰的看到，通过简化返回的字段，可以很显著的成倍提升查询效率。

实际的操作思路就是先通过分页查询满足条件的主键 ID，然后通过主键 ID 查询部分数据，可以显著提升查询效果。

-- 先分页查询满足条件的主键ID
select id from bizuser order by id limit 100000,10;

-- 再通过分页查询返回的ID，批量查询数据
select * from bizuser where id in (1,2,3,4,.....);

2.2、方案二：查询的时候，通过主键 ID 过滤

这种方案有一个要求就是主键ID，必须是数字类型，实践的思路就是取上一次查询结果的 ID 最大值，作为过滤条件，而且排序字段必须有索引，不然分页排序顺序会错乱。

查询 100000～1000100 区间段的数据，仅耗时：18 ms

查询 500000～5000100 区间段的数据，仅耗时：18 ms

查询 1000000～1000100 区间段的数据，仅耗时：18 ms

可以很清晰的看到，带上主键 ID 作为过滤条件，查询性能非常的稳定，基本上在20 ms内可以返回。

这种方案还是非常可行的，如果当前业务对排序要求不多，可以采用这种方案，性能也非常杠！

但是如果当前业务对排序有要求，比如通过客户最后修改时间、客户最后下单时间、客户最后下单金额等字段来排序，那么上面介绍的【方案一】，比【方案二】查询效率更高！

2.3、方案三：采用 elasticSearch 作为搜索引擎
当数据量越来越大的时候，尤其是出现分库分表的数据库，以上通过主键 ID 进行过滤查询，效果可能会不尽人意，例如订单数据的查询，这个时候比较好的解决办法就是将订单数据存储到 elasticSearch 中，通过 elasticSearch 实现快速分页和搜索，效果提升也是非常明显。