MySQL数据库系列内容的学习目录 → \rightarrow →老杜带你学MySQL学习系列内容汇总。
7. 分组查询
分组查询主要涉及到两个子句,分别是:group by
和 having
。
在实际的应用中,可能有这样的需求,需要先进行分组,然后对每一组的数据进行操作,这个时候我们需要使用分组查询。
7.1 group by
- 取得每个工作岗位的工资合计,要求显示岗位名称和工资合计:
select job, sum(sal) from emp group by job;
实现思路:按照工作岗位分组,然后对工资求和。
上述语句的执行顺序:先从emp
表中查询数据,根据job
字段进行分组,然后对每一组的数据进行sum(sal)
。
select ename,job,sum(sal) from emp group by job;
以上语句在mysql中可以执行,但是毫无意义,而在oracle中执行报错。oracle的语法比mysql的语法严格。(mysql的语法相对来说松散一些!)
重点结论: 在一条select
语句当中,如果有group by
语句的话,select
后面只能跟参加分组的字段以及分组函数,其它的一律不能跟。
- 取得同一工作岗位中不同部门的工资合计
实现思路:两个字段联合分组。
原始数据:select * from emp;
分组语句:select job,deptno,sum(sal) from emp group by job,deptno;
7.2 having
如果想对分组数据再进行过滤需要使用 having
子句。
使用having
可以对分完组之后的数据进一步过滤。having
不能单独使用,having
不能代替where
,having
必须和group by
联合使用。
分组函数的执行顺序:1. 根据条件查询数据;
2. 分组;
3. 采用 having
过滤,取得正确的数据。
- 找出每个部门最高薪资,要求显示最高薪资大于3000的。
第一步: 找出每个部门最高薪资,按照部门编号分组,求每一组最大值。
select deptno,max(sal) from emp group by deptno;
第二步: 要求显示最高薪资大于3000。
select deptno,max(sal) from emp group by deptno having max(sal) > 3000;
思考: 以上的sql语句执行效率是不是低?
比较低,实际上可以这样考虑:先将大于3000的都找出来,然后再分组。
优化策略:where
和having
,优先选择where
,where
实在完成不了了,再选择having
。
改为:select job,avg(sal) from emp where sal > 3000 group by deptno;
- 无法使用
where
优化的情况:找出每个部门平均薪资,要求显示平均薪资高于2500的。
第一步: 找出每个部门平均薪资。
select deptno,avg(sal) from emp group by deptno;
第二步: 要求显示平均薪资高于2500的。
select deptno,avg(sal) from emp group by deptno having avg(sal) > 2500;
7.3 select 语句总结
一个完整的 select
语句格式如下:
select 字段
from 表名
where ……
group by ……
having ……(就是为了过滤分组后的数据而存在的,不可以单独的出现)
order by ……
以上语句的执行顺序:1. 首先执行 from
从某种表中查询数据;
2. 执行 where
语句过滤原始数据;
3. 执行 group by
进行分组;
4. 执行 having
对分组数据进行操作;
5. 执行 select
选出数据;
6. 执行 order by
排序。
原则:1. 能在 where
中过滤的数据,尽量在 where
中过滤,效率较高。
2. having
的过滤是专门对分组之后的数据进行过滤的。
为什么分组函数不能直接使用在where后面?例如,select ename,sal from emp where sal > min(sal);
会报错。因为分组函数在使用的时候必须先分组之后才能使用。where
执行的时候,还没有分组,所以where
后面不能出现分组函数。
select sum(sal) from emp;
这个没有分组,为啥sum()
函数可以用呢?因为select
在group by
之后执行。
- 找出每个岗位的平均薪资,要求显示平均薪资大于1500的,除MANAGER岗位之外,要求按照平均薪资降序排。
select
job, avg(sal) as avgsal
from
emp
where
job <> 'MANAGER'
group by
job
having
avg(sal) > 1500
order by
avgsal desc;