背景
在通常的业务场景中,分页一般是使用MySQL提供的 limit 来实现从数据库中获取指定偏移量的数据行。在数据量较小的场景中,并没有太大的问题,但当数据量膨胀到一定程度,获取靠后的分页数据时,性能下降就会特别的大。
原因在于MySQL需要根据偏移量扫描出所有符合的数据,然后再从中取分页记录数返回,其余数据全部丢弃。如 select * from t limit 100000, 10; MySQL需要扫描 100010 行数据并返回最后的10条。
解决方案
1.限制分页数量(减少数据量)
如果业务场景基本上不需要访问到较早之前的历史数据,可以对一段时间之前的历史数据做归档处理,然后在原表中清理掉这部分已归档的数据,减少可分页的数据量。
2.优化大偏移量的性能
基于大部分业务场景需要保留业务数据的完整性,则通过对现有的SQL进行优化,也可以解决问题。
1) 通过延迟关联降低扫描的页面(数据列)
select * from (select id from t limit 100000, 10) tmp inner join t using(id);
上面的语句通过先扫描出对应的主键,然后再回表查询出对应的列,极大的减少了MySQL对数据页的扫描。
2) 预先计算分页所在范围
前提条件是在某个有索引的数据列上可以通过计算出对应分页的范围值,且只可根据该索引列排序。
比如日志表,严格按插入顺序递增,可以使用自增ID主键作为分页的计算依据。假设有以下日志表&#