Limit分页遇到百万级数据该何去何从

一、Limit分页基础

mysql使用查询语句的时候,经常要返回前几条或者中间某几行数据,也就是我们说的分页,语法如下:

SELECT * FROM table LIMIT offset,length

LIMIT 子句可以被用于强制 SELECT 语句返回指定的记录数。LIMIT 接受一个或两个数字参数。参数必须是一个整数常量。如果给定两个参数,第一个参数指定第一个返回记录行的偏移量,第二个参数指定返回记录行的最大数目。具体详情可参考: 理解SpringBoot中的分页竟然如何简单

二、性能分析

1. 案例分析

select * from student limit offset,length

当起始页较小时,查询没有性能问题,我们分别看下从10, 100, 1000,10000,400000,800000开始分页的执行时间(每页取20条)

select * from student limit 10, 20   0.016select * from student limit 100, 20   0.016select * from student limit 1000, 20   0.047select * from student limit 10000, 20   0.094select * from student limit 400000, 20   3.229select * from student  limit 866613, 20   37.44

可以看出随着起始记录的增加,时间也随着增大, 这说明分页语句limit跟记录行的**偏移量(起始页码)**是有很大关系的。

LIMIT 100000, 20 的意思是扫描满足条件的 100001 行,然后扔掉前 100000 行

MySQL 耗费了 大量随机 I/O 在回表查询聚簇索引的数据上,而这 100000 次随机 I/O 查询数据不会出现在结果集中。

像这种分页最大的页码页显然这种时间是无法忍受的。从中我们也能总结出两件事情:

  • limit语句的查询时间与起始记录的位置成正比
  • mysqllimit语句是很方便,但是对记录很多的表并不适合直接使用。

2. 优化方法

利用了索引查询的语句中如果只包含了那个索引列(覆盖索引),那么这种情况会查询很快。在上述例子中,我们知道id字段是主键,自然就包含了默认的主键索引。利用覆盖索引的对查询效果进行测试。

查询最后一页的数据(利用覆盖索引,只包含id列),如下

select id from table limit 866613, 20    0.2

相对于查询了所有列的37.44秒,提升了大概100多倍的速度

那么如果我们也要查询所有列,有两种方法,一种是id>=的形式,另一种就是利用join,看下实际情况:

//使用id> =
SELECT * FROM table WHERE ID > = 866613 limit 20;

类似于查询 SELECT * FROM table WHERE id > 866613 LIMIT 20; 这样的效率非常快,因为主键上是有索引的,但是这样有个缺点,就是id必须是连续的,并且查询不能有WHERE语句,因为WHERE语句会造成过滤数据。

//使用JOIN的方式
SELECT * FROM table a JOIN (select id from table limit 866613, 20) b ON a.id = b.id

MySQL的查询完全命中索引的时候,称为覆盖索引,是非常快的,因为查询只需要在索引上进行查找,之后可以直接返回,而不用再回数据表拿数据。因此我们可以先查出索引的 id,然后根据 id 拿数据。

这2种写法的查询时间都很短,大概0.2s左右


参考文章:https://blog.csdn.net/weixin_37598682/article/details/94547518

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
MySQL是一款常用的关系型数据库管理系统,当数据量达到百万级时,使用常规的分页查询方法可能会导致查询效率低下,因此需要一些优化建议。 1. 使用索引:在分页查询中,使用合适的索引可以大大提高查询速度。对于分页查询,需要对页码(如LIMIT中的offset)以及排序字段进行索引,以减小查询范围。 2. 建立分区:对于大数据量的表,可以根据某个字段对表进行分区,将数据分散存储在多个磁盘上,提高查询效率。 3. 避免全表扫描:尽量避免使用SELECT *,只选择需要的字段,减少数据传输量,优化查询性能。 4. 使用缓存:使用缓存技术,如Memcached或Redis等,在查询结果比较频繁且变化不大的情况下,可以将查询结果缓存起来,减少数据库的压力。 5. 分批查询:可以将大的查询结果分批获取,每次查询一部分数据,实现逐步加载,减少数据库的负载。 6. 合理使用内存:增大MySQL的缓冲池大小,尽量将数据存储在内存中,减少磁盘IO,提高查询性能。 7. 优化查询语句:合理编写查询语句,避免复杂的JOIN、子查询等操作,可以考虑优化查询语句的写法,减少不必要的计算和查询。 8. 使用查询缓存:对于一些经常被查询的数据,可以开启查询缓存功能,将查询结果缓存起来,提高查询性能。 总之,对于百万级数据量的分页查询,需要综合考虑以上建议,并根据具体情况进行优化,合理地使用索引、缓存等技术,以提高查询效率和系统性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

nan feng

打赏一杯咖啡吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值