问题
有如下一个查询:
查询SQL:
select * from tb_record where ctime < 1524758400 AND AND type in (2,4,6,8) id > 131946599 order by id asc limit 1000;
统计SQL:
select count(*) from tb_record where ctime < 1524758400 AND AND type in (2,4,6,8) id > 131946599 order by id asc;
前提:表中id > 131946599的数据量级在千万级。扫描后面的数据耗时长。
当统计SQL的数据大于limit的量(1000)时,查询很快。1s左右能出结果。
当统计SQL的数据量小于1000时,查询就很慢。超时都出不来。
原因
因为如果符合条件的数据足够多,则limit1000的过程就是,从符合条件的第一条数据开始往后查,当查够1000条数据,则立刻返回。
如果符合条件的数据不够,则会从符合条件的第一条数据开始往后扫描,一条条的查,直到把整个表扫描完仍然不够1000条,才会返回结果(不够1000条)。
解决方案:
方案一:
查出满足条件的数据一共有多少条,按照条数处理,最后一个Limit的数量剩余满足条件的数量。
但是,如果查询条件没有索引,统计总共有多少条的将会是个慢查询。
方案二:
类似滑动窗口的方式,每次对id查询idStart+1000=idEnd
范围内的符合条件的数据。凑够1000条的时候返回,但是业务实现就会更加复杂。