SQL统计与分组实战-CSDN博客

本文链接：https://blog.csdn.net/dingchenxixi/article/details/70193634

1.多表查询的操作、限制、笛卡尔积的问题
2.统计函数及分组统计的操作
3.子查询的操作，并且结合限定查询、数据排序、多表查询、统计查询一起完成各个复杂查询的操作
4.数据库的更新操作：增加、修改、删除数据
5.数据伪列的作用：ROWNUM,ROWID；
6.完成一套复杂查询的应用案例

统计函数及分组统计的操作
统计函数

统计函数主要有：
COUNT():用于统计数据数量
SUM():用于统计数据和
AVG()：统计平均值
MIN()：得到最小值
MAX()：得到最大值
测试COUNT(),SUM(),AVG()函数，求出所有员工的总工资，平均工资：

1 select count(empno),sum(sal),avg(sal) from emp;

测试MIN(),MAX()，求出员工中最大工资和最小工资：

select min(sal),max(sal) from emp;

注意关于COUNT()函数，当数据表中没有数据时，COUNT()总是会返回一个数值，只是这个数值是“0”
关注BONUS数据表：

分组统计

当数组重复的时候分组才有意义，因为一个人也可以分为一组，只是没有意义而已，分组采用GROUP BY语句完成，语法如下：
1 SELECT [DISTINCT] * | 列名称 [AS]别名,……..
2 FROM 表名称1 [别名1]
3 [WHERE 条件(s)]
4 [GROUP BY 分组字段1[,分组字段2,...]]
5 [ORDER BY 排序的字段 1,ASC| DESC,排序的字段2 ASC| DESC,….]
例子：
按照部门编号分组，求出每个部门的人数，平均工资

select count(empno),avg(sal) from emp;

按照职位分组，求出每个职位的最高和最低工资：

select job,max(sal),min(sal) from emp group by job;

一旦分组之后，实际上对于语法上就会出现新的限制：
分组函数可在没有分组的时候单独使用，却不能出现其他的查询字段：

ename就是其它查询字段。在select子句之后，只能出现分组的字段和统计函数，其它的字段不能出现

分组函数允许嵌套，但是嵌套之后的分组函数的查询之中不能再出现任何其它字段
例子：按照职位分组，统计平均工资最高的工资

select max(avg(sal)) from emp group by job;

当添加其它字段‘job’之后出现错误
例子：查询出每个部门的名称、位置、部门的人数、平均工资
确定所需的数据表:
emp表：部门的人数，平均工资
dept表：部门的名称，位置
确定已知的关联字段：
emp.deptno = dept.deptno

发现dname存在重复，可以进行分组去除重复，按照之前对分组的理解，只要数据重复那么就有可能进行分组的查询操作，但是此时与之前的分组操作不太一样，之前的分组是针对一张实体表进行分组的(emp,dept都属于实体表)，但是对于以上的数据是通过查询结果显示的，所以是一张临时的虚拟表，但是不管是否是实体表还是虚拟表，只要是有重复，那么就直接进行分组
select d.dname,d.loc,count(e.empno),avg(e.sal) from emp e ,dept d where e.deptno=d.deptno group by d.dname,d.loc;

但是上面这个并不完美，因为dept表中一共有4个部门，那么改善一下，加个连接，同时考虑到部门没有人的话，那么工资肯定是NULL的，所以需要使用到NVL()函数：

select d.dname,d.loc,count(e.empno),nvl(avg(e.sal),0) from emp e ,dept d where e.deptno(+)=d.deptno group by d.dname,d.loc;

或许刚开始你会写成这样：

记住一定是分组字段和统计函数
例子：要求统计出每个部门的详细信息，并且要求这些部门的平均工资高于2000
在以上程序的基础之上，就目前而言，需要加上限定语句where子句，所以考虑用where完成：
1 select d.deptno,d.dname,d.loc,nvl(avg(e.sal),0) from dept d, emp e
2 where d.deptno=e.deptno(+) and nvl(avg(e.sal),0)>2000
3 group by d.deptno,d.dname,d.loc;

本错误提示的核心意思在于where子句中不能使用统计函数，之所以在where子句中不能使用，实际上跟where子句的主要功能有关，where的主要功能是从全部的数据之中取出部门数据，而这种分组完后需要筛选的就需要用到‘HAVING’子句：
1 select d.deptno,d.dname,d.loc,nvl(avg(e.sal),0) from dept d, emp e
2 where d.deptno=e.deptno(+)
3 group by d.deptno,d.dname,d.loc
4 having nvl(avg(e.sal),0)>2000;