MySQL高级学习（7）查询优化

最新推荐文章于 2022-03-11 23:43:42 发布

星河Galaxy

最新推荐文章于 2022-03-11 23:43:42 发布

阅读量251

点赞数

分类专栏： mysql 学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TyphoonHao/article/details/91561053

版权

学习同时被 2 个专栏收录

33 篇文章 0 订阅

订阅专栏

13 篇文章 0 订阅

订阅专栏

一、关联查询优化

（1）保证被驱动表的join字段已经被索引

（2）left join 时，选择小表作为驱动表，大表作为被驱动表。

（3）inner join 时，mysql会自己帮你把小结果集的表选为驱动表。

（4）子查询尽量不要放在被驱动表，有可能使用不到索引。

二、子查询优化

（1）有索引的情况下：用 inner join 是最好的其次是 in ，exists最糟糕

（2）无索引的情况下用

a.小表驱动大表

因为join 方式需要distinct ，没有索引distinct消耗性能较大所以 exists性能最佳 in其次 join性能最差？

b.无索引的情况下大表驱动小表

in 和 exists 的性能应该是接近的都比较糟糕 exists稍微好一点超不过5% 但是inner join 优于使用了 join buffer 所以快很多如果left join 则最慢

三、order by 查询优化

1.ORDER BY子句，尽量使用Index方式排序,避免使用FileSort方式排序

MySQL支持二种方式的排序，FileSort和Index，Index效率高.

它指MySQL扫描索引本身完成排序。FileSort方式效率较低。

2.ORDER BY满足两情况，会使用Index方式排序:

（1）ORDER BY 语句使用索引最左前列

（2）使用Where子句与Order BY子句条件列组合满足索引最左前列

（3）where子句中如果出现索引的范围查询(即explain中出现range)会导致order by 索引失效。

3.尽可能在索引列上完成排序操作，遵照索引建的最佳左前缀

index(a,b,c)

where a = const and b > const order by b , c 不会出现 using filesort b , c 两个衔接上了

但是：where a = const and b > const order by c 将会出现 using filesort 。因为 b 用了范围索引，断了。而上一个 order by 后的b 用到了索引，所以能衔接上 c

4.如果不在索引列上，filesort有两种算法：双路排序和单路排序

（1）双路排序

a.MySQL 4.1之前是使用双路排序,字面意思就是两次扫描磁盘，最终得到数据，读取行指针和orderby列，对他们进行排序，然后扫描已经排序好的列表，按照列表中的值重新从列表中读取对应的数据输出

b.从磁盘取排序字段，在buffer进行排序，再从磁盘取其他字段。

多路排序需要借助磁盘来进行排序。所以取数据，排好了取数据。两次 io操作。比较慢

单路排序，将排好的数据存在内存中，省去了一次 io 操作，所以比较快，但是需要内存空间足够。

（2）单路排序

a.取一批数据，要对磁盘进行了两次扫描，众所周知，I\O是很耗时的，所以在mysql4.1之后，出现了第二种改进的算法，就是单路排序。

b.从磁盘读取查询需要的所有列，按照order by列在buffer对它们进行排序，然后扫描排序后的列表进行输出，

它的效率更快一些，避免了第二次读取数据。并且把随机IO变成了顺序IO,但是它会使用更多的空间，因为它把每一行都保存在内存中了。

（3）结论及引申出的问题

a.由于单路是后出的，总体而言好过双路

b.但是用单路有问题

在sort_buffer中，方法B比方法A要多占用很多空间，因为方法B是把所有字段都取出, 所以有可能取出的数据的总大小超出了sort_buffer的容量，导致每次只能取sort_buffer容量大小的数据，进行排序（创建tmp文件，多路合并），排完再取取sort_buffer容量大小，再排……从而多次I/O。本来想省一次I/O操作，反而导致了大量的I/O操作，反而得不偿失。

（4）优化策略

a.增大sort_buffer_size参数的设置:用于单路排序的内存大小

b.增大max_length_for_sort_data参数的设置:单次排序字段大小。(单次排序请求)

c.去掉select 后面不需要的字段:select 后的多了，排序的时候也会带着一起，很占内存，所以去掉没有用的

提高Order By的速度

1. Order by时select * 是一个大忌只Query需要的字段这点非常重要。在这里的影响是：

a.当Query的字段大小总和小于max_length_for_sort_data 而且排序字段不是 TEXT|BLOB 类型时，会用改进后的算法——单路排序，否则用老算法——多路排序。

b. 两种算法的数据都有可能超出sort_buffer的容量，超出之后，会创建tmp文件进行合并排序，导致多次I/O，但是用单路排序算法的风险会更大一些,所以要提高sort_buffer_size。

2. 尝试提高 sort_buffer_size

不管用哪种算法，提高这个参数都会提高效率，当然，要根据系统的能力去提高，因为这个参数是针对每个进程的

3. 尝试提高 max_length_for_sort_data

提高这个参数，会增加用改进算法的概率。但是如果设的太高，数据总容量超出sort_buffer_size的概率就增大，明显症状是高的磁盘I/O活动和低的处理器使用率. 阿萨德

四、group by 查询优化

group by 跟order by的优化策略是一样的 group by是县排序再分组

1.group by实质是先排序后进行分组，遵照索引建的最佳左前缀

2.当无法使用索引列，增大max_length_for_sort_data参数的设置+增大sort_buffer_size参数的设置

3.where高于having，能写在where限定的条件就不要去having限定了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
MySQL高级学习（7）查询优化

一、关联查询优化（1）保证被驱动表的join字段已经被索引（2）left join 时，选择小表作为驱动表，大表作为被驱动表。（3）inner join 时，mysql会自己帮你把小结果集的表选为驱动表。（4）子查询尽量不要放在被驱动表，有可能使用不到索引。二、子查询优化（1）有索引的情况下：用 inner join 是最好的其次是 in ，exists最糟糕...
复制链接

扫一扫

专栏目录

星河Galaxy CSDN认证博客专家 CSDN认证企业博客

码龄7年

41: 原创

55万+: 周排名

74万+: 总排名

6万+: 访问

: 等级

1030: 积分

8: 粉丝

15: 获赞

3: 评论

25: 收藏

私信

关注

分类专栏

数据结构学习 7篇
记录 5篇
阿里云服务 2篇
学习 33篇
restful 1篇
laravel服务容器 2篇
IoC 1篇
laravel 3篇
mysql 13篇
数据结构 7篇
docker 3篇
redis 4篇
PHP 4篇
深入学习 3篇

最新评论

MySQL高级学习（7）查询优化
Deep Learning小舟: 知道了，谢谢啦！(^ ^)
PHP深入学习--调用上下文和解析上下文
bigbol: 如果有机会看到的话，作者自己执行一下例二。B里面的printValue是忘记删除了吗？
laravel解析-入口应用初始化
CoderTH: 写的真的挺好，花了两个小时好好研究了一下，受益匪浅

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。