MySQL | 使用 limit 优化查询和防止SQL被优化



查询优化

1.1 最大值和最小值的优化

对于 MIN()MAX() 查询,MySQL 的优化做的并不是太好,例如

select MIN(id) FROM film where name = '西游记'

假设表 film 数据如下:

idnameprice
1英雄本色12
2哪吒传奇14
3西游记34
4水浒传23
5红楼梦34
6红与黑2
7红与黑4
8美人鱼23
9爸爸归来23
10我是谁12
11喜羊羊56
12西游记67

其中 id 为主键并自增,namevarchar 且没有索引

因为 name 没有索引,因为 MySQL 将会进行一次全表扫描。因为 id 为自增,那么我们可以当作,第一次找到 name='西游记'时,id 就为我们想要的结果,此时我们可以改写 SQL 为:

select id FROM film where name = '西游记' limit 1

此时当查到第一条记录时,就会停止继续查询,获得更高的性能。

1.2 优化 limit 分页

在系统进行分页操作的时候,当偏移量大时,例如:limit 10000,20 时,MySQL 需要查询 10020 条记录然后只返回 20 记录,前面的记录全部被舍弃,这样的代价非常高

SELECT id, name, price FROM file LIMIT 10000 OFFSET 20

上面的 SQL 我想是分页常规的写法,写法没有什么错误,正如上面说到,浪费了大量的性能。

1.2.1 使用关联查询优化

优化此类查询一个简单的方法就是尽可能地使用索引覆盖扫描,而不是查询所有的列,然后根据需要做一次关联操作再返回所需的列。对于偏移大的时候,这样做的效率提升非常大。

SELECT
    id, name, price
FROM film
INNER JOIN (
    SELECT id
    FROM film
    LIMIT 10000 OFFSET 20
    ) AS LIM USING(id)

1.2.2 使用范围查询

有时候可以将 LIMIT 转化为已知位置的查询,让 MySQL 通过范围扫描获得到对应的结果。例如,如果在一个位置列上有索引,并且预先计算出了边界值,则改写查询为:

SELECT id, name, price
FROM film
WHERE position BETWEEN 10000 AND 10020
ORDER BY position

1.2.3 利用唯一自增序列进行查询

这里的唯一自增序列可以是自增 id 主键,也可以其他的具有唯一和升序的数字即可

在前面的思路中,我们考虑的都是传入页数和每页数量,在一些操作中可以改为传入上一次查询到的自增序列,然后往后查询对应的每页数量即可。

例如原来要求前端传入页数(pageIndex)和 每页数量(pageSize), 此时的 SQL 为

select * from film 
limit (pageIndex -1) * pageSize OFFSET pageIndex * pageSize

如果改为让前端传入最后一次查询到结果的 自增序列(sid) 和 每页数量(pageSize)

比如这时的自增序列(sid) 就是 film 的 id, 则 SQL 可以改写成

select * from film 
where id > sid
limit pageSize

当查第一页的时候,sid 传入 0 即可,查第二页的时候,传入获取第一页时最后得到 id 即可

防止被优化

在写 SQL 的时候,除了要考虑优化 SQL 降低执行时间外,有时还要防止 SQL 被 MySQL 本身给你优化掉,造成执行结果和你想象的不一样。

在 MySQL 使用 group by 语句进行查询时,当有多条数据都满足时,会显示第一条数据例如:

假设表 film 数据如下:

idnameprice
1英雄本色12
2哪吒传奇14
3西游记34
4水浒传23
5唐探380
6唐探350

则执行SQL select * from film group by name, 则结果为:

idnameprice
1英雄本色12
2哪吒传奇14
3西游记34
4水浒传23
5唐探380

但在一些数据重复时,我们往往想要最后一条数据, 这是我们会想到通过子查询的形式先排序后group by 如下:

select *
from ( select * from film order by id desc) as film_ordered
group by name;

执行后发现结果没变, 这是因为 MySQL5.7 会对子查询进行优化,认为子查询中的 order by 可以进行忽略,只要Derived table里不包含如下条件就可以进行优化:

  • UNION clause
  • GROUP BY
  • DISTINCT
  • Aggregation
  • LIMIT or OFFSET

根据上面说明,我们可以使用 limit 阻止子查询优化,改写后SQL

select *
from ( select * from film order by id desc limit 10000000) as film_ordered
group by name;

这样结果就符合我们想要的了

参考

https://blog.csdn.net/lglaljj123/article/details/79864188

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 使用索引 在MySQL中,如果WHERE条件中使用了索引列,那么limit语句的执行效率会大大提高。因此,在分页查询中,如果能使用索引来过滤数据,就能提高查询效率。例如: SELECT * FROM table WHERE index_column > 10 LIMIT 10; 2. 使用覆盖索引 覆盖索引是指在查询中,所有需要的数据都可以从索引中获取,不需要再去查询数据表。因此,使用覆盖索引可以减少查询的IO操作,提高查询效率。例如: SELECT index_column FROM table WHERE index_column > 10 LIMIT 10; 3. 使用游标 游标是在查询结果中移动的指针,可以用来遍历查询结果。在分页查询中,使用游标可以提高效率。例如: SELECT * FROM table WHERE index_column > 10 ORDER BY index_column LIMIT 10; SET @rownum:=0; SELECT * FROM ( SELECT @rownum:=@rownum+1 AS rownum, table.* FROM table WHERE index_column > 10 ORDER BY index_column ) AS t WHERE rownum > 10 LIMIT 10; 4. 使用缓存 在分页查询中,如果查询条件相同,可以使用缓存来缓存查询结果,避免重复查询。例如: SELECT SQL_CACHE * FROM table WHERE index_column > 10 LIMIT 10; 5. 避免使用查询 在分页查询中,尽量避免使用查询,因为子查询会增加查询的复杂度和查询时间,降低查询效率。例如: SELECT * FROM table WHERE index_column > 10 AND column IN (SELECT column FROM table2); 6. 避免使用ORDER BY 在分页查询中,尽量避免使用ORDER BY,因为排序会增加查询的复杂度和查询时间,降低查询效率。例如: SELECT * FROM table WHERE index_column > 10 ORDER BY column LIMIT 10; 7. 避免使用SELECT * 在分页查询中,尽量避免使用SELECT *,因为会查询所有列,增加查询的复杂度和查询时间,降低查询效率。应该只查询需要的列。例如: SELECT column1, column2 FROM table WHERE index_column > 10 LIMIT 10;

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值