group by的工作原理和优化思路

最新推荐文章于 2024-07-07 16:53:23 发布

xushiyu1996818

最新推荐文章于 2024-07-07 16:53:23 发布

阅读量1.2k

点赞数 1

分类专栏： mysql 文章标签： sql 数据库 database

本文链接：https://blog.csdn.net/xushiyu1996818/article/details/125013435

版权

本文深入探讨了SQL中的GROUP BY语句的工作原理，包括其执行流程、临时表和排序的细节。同时，文章分析了WHERE和HAVING子句的区别，并提供了使用GROUP BY时的注意事项和一系列优化策略，如添加索引、避免排序和调整内存临时表大小等，旨在帮助开发者提升SQL查询性能。

摘要由CSDN通过智能技术生成

group by一定要配合聚合函数使用嘛？

group by 后面跟的字段一定要出现在select中吗？

注意：本文参考 group by的工作原理和优化思路_Java技术债务的博客-CSDN博客

引入

日常开发中，我们经常会使用到group by。你是否知道group by的工作原理呢？group by和having有什么区别呢？group by的优化思路是怎样的呢？使用group by有哪些需要注意的问题呢？

使用group by的简单例子
group by 工作原理
group by + where 和 having的区别
group by 优化思路
group by 使用注意点
一个生产慢SQL如何优化
使用group by的简单例子

group by一般用于分组统计，它表达的逻辑就是根据一定的规则，进行分组。我们先从一个简单的例子，一起来复习一下哈。

假设用一张员工表，表结构如下：

CREATE TABLE `staff` (
  `id` bigint(11) NOT NULL AUTO_INCREMENT COMMENT '主键id',
  `id_card` varchar(20) NOT NULL COMMENT '身份证号码',
  `name` varchar(64) NOT NULL COMMENT '姓名',
  `age` int(4) NOT NULL COMMENT '年龄',
  `city` varchar(64) NOT NULL COMMENT '城市',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=15 DEFAULT CHARSET=utf8 COMMENT='员工表';

表存量的数据如下：

有这么一个需求：统计每个城市的员工数量。对应的 SQL 语句就可以这么写：

select city ,count(*) as num from staff group by city;

执行结果如下：

这条SQL语句的逻辑很清楚啦，但是它的底层执行流程是怎样的呢？

group by 原理分析

explain 分析

我们先用explain查看一下执行计划

explain select city ,count(*) as num from staff group by city;

Extra 这个字段的Using temporary表示在执行分组的时候使用了临时表

Extra 这个字段的Using filesort表示使用了排序

group by 怎么就使用到临时表和排序了呢？我们来看下这个SQL的执行流程

group by 的简单执行流程

explain select city ,count(*) as num from staff group by city;

创建内存临时表，表里有两个字段city和num；

全表扫描staff的记录，依次取出city = 'X’的记录。

判断临时表中是否有为 city='X’的行，没有就插入一个记录 (X,1);

如果临时表中有city='X’的行的行，就将x 这一行的num值加 1；

遍历完成后，再根据字段city做排序，得到结果集返回给客户端。

这个流程的执行图如下：

最低0.47元/天解锁文章

xushiyu1996818

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录