group by 是怎样工作的

最新推荐文章于 2025-02-06 09:43:00 发布

三易的博客

最新推荐文章于 2025-02-06 09:43:00 发布

阅读量347

点赞数

分类专栏： mysql 文章标签：数据库 mysql

本文链接：https://blog.csdn.net/liang_love_java/article/details/120029013

版权

mysql 专栏收录该内容

12 篇文章

订阅专栏

本文深入探讨了SQL中的GROUP BY语句的执行流程，解释了为何需要创建临时表，并提供了两种优化策略：一是通过添加索引来减少扫描行数，二是使用SQL_BIG_RESULT避免排序。优化GROUP BY操作对于提升数据库查询性能至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数据准备

CREATE TABLE `t2` (
  `id` int(11) NOT NULL,
  `a` int(11) DEFAULT NULL,
  `b` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `index_a` (`a`)
) ENGINE=InnoDB;

在表 t2 中插入数据 100 条数据
for(int i=1; i<=100; i++) {
    insert into t2(id, a, b) values(i, i, i);
}

group by 执行流程

sql select b, count(*) as count from t2 group by b;

1：创建临时表，表里有两个字段 b 和 count，主键是 b

2：对表 t2 进行全表扫描，依次取出每条记录的字段 b（该步骤会扫描临时表的主键来定位记录）

如果临时表中没有主键为 b 的行，就插入一个记录 (b,1)
如果表中有主键为 b 的行，就将 b 这一行的 count字段对应的值加 1

3：遍历完成后，再根据字段 b 做排序（参考 order by 是怎样工作的），得到结果集返回给客户端

这里说明一下，通过查看慢日志，sql的实际扫描行数是300行，为什么是300行。

首先对t2进行全表扫描，这就是100行
在扫描临时表主键的时候，每次会扫描 1 行，会扫描 100次，这就是 100行（扫描100次是，因为 t2 表有 100条记录）
步骤3，要对临时表根据字段 b 做排序（这里假设 sort buffer 足够大，并且使用的是全字段排序），所以对临时表进行一次全表扫描，临时表的记录条数100，这就是 100 行。

在sql语句后面添加 order by null 可以避免步骤 3 的排序工作

select b, count(*) as count from t2 group by b order by null；

扫描行数为 200 行