group by 查询慢的话,如何优化？

流光影下

已于 2024-06-05 11:15:48 修改

阅读量3.6k

点赞数 22

文章标签：数据库 oracle

于 2024-01-13 22:52:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liu289747235/article/details/135577433

版权

本文探讨了SQLGROUPBY操作的性能瓶颈，涉及内存临时表限制、磁盘临时表使用、添加索引、避免排序以及利用SQL_BIG_RESULT。通过分析groupby原理和执行流程，提出优化方案以提升查询效率。

摘要由CSDN通过智能技术生成

1、说明

根据一定的规则，进行分组。

group by可能会慢在哪里？因为它既用到临时表，又默认用到排序。有时候还可能用到磁盘临时表。

如果执行过程中，会发现内存临时表大小到达了上限（控制这个上限的参数就是tmp_table_size），会把内存临时表转成磁盘临时表。
如果数据量很大，很可能这个查询需要的磁盘临时表，就会占用大量的磁盘空间。

2、如何优化group by呢?

group by 后面的字段加索引
order by null 不用排序
尽量只使用内存临时表
使用SQL_BIG_RESULT

3、使用group by的简单例子

select city ,count(*) as num from staff group by city;

4、group by 原理分析

Extra 这个字段的Using temporary表示在执行分组的时候使用了临时表
Extra 这个字段的Using filesort表示使用了排序

5、group by 的简单执行流程

创建内存临时表，表里有两个字段author和count；
全表扫描article的记录，依次取出author= ‘X’的记录。

判断临时表中是否有为 author=’X’的行，没有就插入一个记录 (X,1);
如果临时表中有author=’X’的行的行，就将x 这一行的num值加 1；

遍历完成后，再根据字段author做排序，得到结果集返回给客户端

就是把需要排序的字段，放到sort buffer，排完就返回。在这里注意一点哈，排序分全字段排序和rowid排序

如果是全字段排序，需要查询返回的字段，都放入sort buffer，根据排序字段排完，直接返回

如果是rowid排序，只是需要排序的字段放入sort buffer，然后多一次回表操作，再返回。

怎么确定走的是全字段排序还是rowid 排序排序呢？由一个数据库参数控制的，max_length_for_sort_data

6、group by的一些优化方案

group by 后面的字段加索引
order by null 不用排序
尽量只使用内存临时表
使用SQL_BIG_RESULT

关注

22
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

流光影下 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。