聚合函数
在介绍GROUP BY 和HAVING子句前,我们先讲讲sql语言中的一种特殊的函数:聚合函数.
例如SUM,COUNT,MAX,AVG等。这些函数和其他函数的根本区别就在于它们一般作用于多个纪录上。
select SUM(population) FROM bbc;
这里的SUM作用在所有返回记录的population字段上,结果就是该查询只返回一个结果,即所有 国家的总人口数。
通过使用GROUP BY子句,可以让SUM和COUNT这些函数对属于一组的数据起作用。当你指定GROUP BY region时,属于同一个region(地区)的一组数据将只能返回一行值。也就是说,表中所有出region(地区)外的字段,只能通过SUM,COUNT等聚合函数运算后返回一个值。
HAVING子句可以让我们筛选成组后的各组数据。
WHERE子句在聚合前线筛选纪录,也就是说作用在GROUP BY子句和HAVING子句前。而HAVING子句在聚合后对组纪录进行筛选。
SQL实例:
一、显示各个地区的总人口数和总面积
SELECT region,SUM(population),SUM(area)
FROM bbc
GROUP BY region;
先以region把返回纪录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每个组中的不同字段(一或多条纪录)作运算。
二、显示每个地区的总人口数和总面积,仅显示那些面积超过1000 000的地区。
SELECT region,SUM(population),SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(area) > 1000000;
在这里,我们不能用where来筛选超过1000000的底气,因为表中不存在这样一条纪录。相反,HAVING子句可以让我们筛选成组后的各组数据。
GROUP BY 用法解析
group by语法可以根据给定数据列的每个成员对查询结果进行分组统计,最终得到一个分组汇总表。
SELECT子句中的列名必须为分组列或列函数。列函数对于GROUP BY子句定义的每个组各返回一个结果。
某个员工信息表结构和数据如下:
例如,我想列出每个部门最高薪水的结果
SELECT DEPT, MAX(SALARY) AS MAXIMUM
FROM STAFF
GROUP BY DEPT;
查询结果如下:
DEPT MAXIMUM
开发部 2500
设计部 2600
销售部 3500
解释一下结果:
1、满足“SELECT子句中的列名必须为分组列或列函数”,因为SELECT有GROUP BY DEPT中包含的列DEPT。
2、“列函数对于GROUP BY子句定义的每个组各返回一个结果”,根据部门分组,对每个部门返回一个结果,就是每个部门的最高薪水。
注意:计算的是每个部门(由 GROUP BY 子句定义的组)而不是整个公司的 MAX(SALARY)。
例如,查询每个部门的总的薪水数
SELECT DEPT, sum( SALARY ) AS total
FROM STAFF
GROUP BY DEPT;
查询结果如下:
DEPT total
开发部 4500
设计部 7000
销售部 9600
将 WHERE 子句与 GROUP BY 子句一起使用
分组查询可以在形成组和计算列函数之前具有消除非限定行的标准 WHERE 子句。必须在GROUP BY 子句之前指定 WHERE 子句。
例如,查询公司2010年入职的各个部门每个级别里的最高薪水
SELECT DEPT, delevel, MAX( SALARY ) AS MAXIMUM
FROM staff
WHERE HIREDATE > '2014-01-01'
GROUP BY DEPT, delevel
ORDER BY DEPT, delevel;
查询结果如下:
DEPT EDLEVEL MAXIMUM
设计部 4 2300
设计部 5 2600
销售部 5 3000
销售部 7 3500
注意:在SELECT语句中指定的每个列名也在GROUP BY子句中提到。未在这两个地方提到的列名将产生错误。
GROUP BY子句对DEPT和EDLEVEL的每个唯一组合各返回一行。
在GROUP BY子句之后使用HAVING子句
可应用限定条件进行分组,以便系统仅对满足条件的组返回结果。为此,在GROUP BY子句后面包含一个HAVING子句。HAVING子句可包含一个或多个用AND和OR连接的谓词。每个谓词将组特性(如AVG(SALARY))与下列之一进行比较:
例如:寻找雇员数超过2个的部门的最高和最低薪水:
SELECT DEPT, MAX( SALARY ) AS MAXIMUM, MIN( SALARY ) AS MINIMUM
FROM staff
GROUP BY DEPT
HAVING COUNT( * ) >2
ORDER BY DEPT;
查询结果如下:
DEPT MAXIMUM MINIMUM
设计部 2600 2100
销售部 3500 3000
例如:寻找雇员平均工资大于3000的部门的最高和最低薪水:
SELECT DEPT, MAX( SALARY ) AS MAXIMUM, MIN( SALARY ) AS MINIMUM
FROM staff
GROUP BY DEPT
HAVING AVG( SALARY ) >3000
ORDER BY DEPT;
查询结果如下:
DEPT MAXIMUM MINIMUM
销售部 3500 3000