MySql高级-排序优化（四）

沉泽·

已于 2022-04-08 14:38:56 修改

阅读量594

点赞数

分类专栏： mysql 文章标签： mysql sql 数据库

于 2021-09-17 11:47:27 首次发布

原文链接：https://blog.csdn.net/qq_38826019/article/details/116722432

版权

mysql 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

一、查询优化

1.1 小表驱动大表

永远小表驱动大表，类似嵌套循环Nested Loop
在这里插入图片描述

EXISTS

SELECT … FROM table WHERE EXISTS (subquery)

该语法可以理解为。将主查询的数据，放到子查询中做条件验证，根据验证结果（TRUE或FALSE)来决定主查询的数据结果是否得以保留。

提示

1.EXISTS(subquery)只返回TRUE 或FALSE，因此子查询中的SELECT*也可以是select 1或select’X’，官方说法是实际执行时会忽略SELECT清单，因此没有区别

2.EXSTS子查询的实际执行过程可能经过了优化而不是我们理解上的逐条对比，如果担忧效率问题，可进行实际检验以确定是否有效率问题。3EXSTS子查询往往也可以用条件表达式、其他子查询或者JOIN来替代，何种最优需要具体问题具体分析。

有关exists和in的解说，请参考：
https://blog.csdn.net/weixin_41979002/article/details/118730611

1.2 order by关键字优化

1.2.1 尽量使用index方式排序

order by子句，尽量使用index方式排序，避免使用filesort方式排序

1.建表sql

create table tblA(
age int,
birth timestamp not null
);
 
insert into tblA(age,birth) values (22,now());
insert into tblA(age,birth) values (23,now());
insert into tblA(age,birth) values (24,now());
 
 
create index idx_A_ageBirth on tblA(age,birth);
 
select * from tblA;

2.案例
在这里插入图片描述

MySQL支持两种排序方式，filesort和index，index效率更高，它值MySQL扫描索引本身完成的排序。filesort效率较低。

order by满足两种情况，会使用index方式排序：

1.order by子句使用索引的最左前列。

2.使用where子句和order by子句里的条件列组合，满足索引最左前列时。

尽可能的在索引列上完成排序操作，遵照索引键的最佳左前缀原则。

1.2.2 双路排序和单路排序
如果不在索引列上，filesort有两种算法。双路排序、单路排序。

双路排序：

MySQL4.1之前使用的是双路排序，需要扫描两次磁盘才能得到最终数据。读取行指针和order by列，对它们进行排序，然后扫描已经排好序的列表，按照列表中的值,重新从列表中读取数据输出。

从磁盘里取排序字段,在buffer进行排序，再从磁盘取其它字段。

取一批数据，要对磁盘进行两次扫描，因为I/o是很耗时的，所以在MySQL4.1之后，出现了第二种改进的算法→单路排序。

单路排序：

从磁盘中读取查询的所有列，按照order by列在buffer对它们进行排序，然后扫描排序后的列表进行输出。它的效率更快，避免了第二次读取数据，并且把随机IO变为了顺序IO，但它会使用更多的空间，因为它把每一行都保存在了内存中。

结论及引申出的问题：

由于单路排序算法后出，所以总体而言比双路的好。

单路的弊端：

在sort_buffer中，方法B比方法A要多占用很多空间，因为方法B是把所有字段都取出,所以有可能取出的数据的总大小超出了sort_buffer的容量，导致每次只能取sort_buffer容量大小的数据，进行排序（创建tmp文件，多路合并），

排完再取sort_buffer容量大小，再排……从而多次I/O。本来想省一次l/O操作，反而导致了大量的I/O操作，反而得不偿失。

1.2.3 优化策略

1.增大sort_buffer_size参数的设置

2.增大max_length_for_sort_data参数的设置
在这里插入图片描述

1.2.4 小总结

在这里插入图片描述

1.3 group by关键字优化

1.group by实质是先排序后进行分组，遵照索引建的最佳左前缀。

2.当无法使用索引列，增大max_length_for_sort_data参数的设置+增大sort_buffer_size参数的设置

3.where高于having，能写在where限定的条件就不要去having限定了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。