group by的使用

最新推荐文章于 2023-04-02 15:35:44 发布

全冉

最新推荐文章于 2023-04-02 15:35:44 发布

阅读量799

点赞数

分类专栏： mysql 文章标签： group by

本文链接：https://blog.csdn.net/qq_23167527/article/details/78730778

版权

mysql 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一.group by 用法解析
group by语法可以根据给定数据列的每个成员对查询结果进行分组统计，最终得到一个分组汇总表。
SELECT子句中的列名必须为分组列或列函数。列函数对于GROUP BY子句定义的每个组各返回一个结果。

某个员工信息表结构和数据如下：
  id  name  dept  salary  edlevel  hiredate 
      1 张三 开发部 2000 3 2009-10-11
      2 李四 开发部 2500 3 2009-10-01
      3 王五 设计部 2600 5 2010-10-02
      4 王六 设计部 2300 4 2010-10-03
      5 马七 设计部 2100 4 2010-10-06
      6 赵八 销售部 3000 5 2010-10-05
      7 钱九 销售部 3100 7 2010-10-07
      8 孙十 销售部 3500 7 2010-10-06

例如，我想列出每个部门最高薪水的结果，sql语句如下：
SELECT DEPT, MAX(SALARY) AS MAXIMUM
FROM STAFF
GROUP BY DEPT
查询结果如下：
      DEPT  MAXIMUM 
      开发部 2500
      设计部 2600
      销售部 3500
解释一下这个结果：
1、满足“SELECT子句中的列名必须为分组列或列函数”，因为SELECT有GROUP BY DEPT中包含的列DEPT。
2、“列函数对于GROUP BY子句定义的每个组各返回一个结果”，根据部门分组，对每个部门返回一个结果，就是每个部门的最高薪水。
注意：计算的是每个部门（由 GROUP BY 子句定义的组）而不是整个公司的 MAX(SALARY)。

例如，查询每个部门的总的薪水数
SELECT DEPT, sum( SALARY ) AS total
FROM STAFF
GROUP BY DEPT
查询结果如下：
DEPT  total 
开发部 4500
设计部 7000
销售部 9600


二.将 WHERE 子句与 GROUP BY 子句一起使用
分组查询可以在形成组和计算列函数之前具有消除非限定行的标准 WHERE 子句。必须在GROUP BY 子句之前指定 WHERE 子句。
例如，查询公司2010年入职的各个部门每个级别里的最高薪水
SELECT DEPT, EDLEVEL, MAX( SALARY ) AS MAXIMUM
FROM staff
WHERE HIREDATE > '2010-01-01'
GROUP BY DEPT, EDLEVEL
ORDER BY DEPT, EDLEVEL
查询结果如下：
  DEPT  EDLEVEL  MAXIMUM 
      设计部 4 2300
      设计部 5 2600
      销售部 5 3000
      销售部 7 3500
注意：在SELECT语句中指定的每个列名也在GROUP BY子句中提到。未在这两个地方提到的列名将产生错误。
GROUP BY子句对DEPT和EDLEVEL的每个唯一组合各返回一行。


三.在GROUP BY子句之后使用HAVING子句
可应用限定条件进行分组，以便系统仅对满足条件的组返回结果。为此，在GROUP BY子句后面包含一个HAVING子句。HAVING子句可包含一个或多个用AND和OR连接的谓词。每个谓词将组特性（如AVG(SALARY)）与下列之一进行比较：

例如：寻找雇员数超过2个的部门的最高和最低薪水：
SELECT DEPT, MAX( SALARY ) AS MAXIMUM, MIN( SALARY ) AS MINIMUM
FROM staff
GROUP BY DEPT
HAVING COUNT( * ) >2
ORDER BY DEPT
查询结果如下：
  DEPT  MAXIMUM  MINIMUM 
      设计部 2600 2100
      销售部 3500 3000

例如：寻找雇员平均工资大于3000的部门的最高和最低薪水：
SELECT DEPT, MAX( SALARY ) AS MAXIMUM, MIN( SALARY ) AS MINIMUM
FROM staff
GROUP BY DEPT
HAVING AVG( SALARY ) >3000
ORDER BY DEPT
查询结果如下：
  DEPT  MAXIMUM  MINIMUM 
      销售部 3500 3000

四.Where与Having的区别

地球人都知道，Where关键字的作用是过滤，选取符合条件的记录，而Having关键字的作用则是，为聚合结果指定条件。但是，在某些条件下，使用这两者可以得到一样的结果。
比如以下的例子：
sql1 语句:
	SELECT BoxType,COUNT(1) FROM BoxType 
	GROUP BY BoxType
	HAVING BoxType='小箱';
sql2 语句:
	SELECT BoxType,COUNT(1) FROM BoxType
	WHERE BoxType='小箱'
	GROUP BY BoxType;
这两段语句得到的结果是一样的，那么他们两者的区别在哪呢？

1.首先，Where 子句是用来指定 "行" 的条件的，而Having 子句是指定 “组” 的条件的，即
	Where 子句 = 指定行所对应的条件
	Having 子句 = 指定组所对应的条件
换句话说：
	用having就一定要和group by连用，
	用group by不一有having （它只是一个筛选条件用的）
因此，sql2 语句会比较合适。

2.其次，当在Where子句和Having子句中都可以使用的条件，从语句的执行效率来看，最好写在Where子句中。
(1)在使用Count函数等对表中的数据进行聚合操作时，DBMS内部会进行排序处理，而排序操作会增加机器的负担，减少排序的行数，可以增加处理速度。
(2)使用Where子句指定条件时，由于排序之前就对数据进行了过滤，所以能够减少排序的数据量。但是Having子句是在排序之后才对数据进行分组的，因此与前者相比，需要排序的数据量就要多得多。
(3)使用Where子句更具速度优势的另一个理由是，可以对Where子句指定条件所对应的列创建索引，这样可以大幅提高处理速度。
(4)Where子句中不能使用聚合函数，而Having子句中可以。