Oracle高级查询之over(partition by...) 分组排序

                                             Oracle高级查询之over(partition by...) 分组排序

一、rank()/dense_rank() over(partition by ...order by ...)

现在客户有这样一个需求,查询每个部门工资最高的雇员的信息,相信有一定oracle应用知识的同学都能写出下面的SQL语句:

  1. select * from (select ename, job, hiredate, e.sal, e.deptno  
  2.           from emp e,  
  3.                (select deptno, max(sal) sal from emp group by deptno) t  
  4.          where e.deptno = t.deptno  
  5.            and e.sal = t.sal)  
  6.  order by deptno;  
  7.           
  8. select * from (select ename 姓名, job 职业, hiredate 入职日期, e.sal 工资, e.deptno 部门  
  9.           from emp e,  
  10.                (select deptno, max(sal) sal from emp group by deptno) t  
  11.          where e.deptno = t.deptno  
  12.            and e.sal = t.sal)  
  13.  order by 部门;  

 

在满足客户需求的同时,大家应该习惯性的思考一下是否还有别的方法。这个是肯定的,就是使用本小节标题中rank() over(partition by...)或dense_rank() over(partition by...)语法,SQL分别如下

  1. select empno, ename, job, hiredate, sal, deptno  
  2.   from (select empno, ename, job, hiredate, sal, deptno, rank() over(partition by deptno order by sal desc) r from emp)  
  3.  where r = 1;  
  4.    
  5. select empno, ename, job, hiredate, sal, deptno  
  6.   from (select empno, ename, job, hiredate, sal, deptno, dense_rank() over(partition by deptno order by sal desc) r from emp)  
  7.  where r = 1  

为什么会得出跟上面的语句一样的结果呢?这里补充讲解一下rank()/dense_rank() over(partition by e.deptno order by e.sal desc)语法。
over:  在什么条件之上。
partition by e.deptno:  按部门编号划分(分区)。
order by e.sal desc:  按工资从高到低排序(使用rank()/dense_rank() 时,必须要带order by否则非法)
rank()/dense_rank():  分级
整个语句的意思就是:在按部门划分的基础上,按工资从高到低对雇员进行分级,“级别”由从小到大的数字表示(最小值一定为1)。 

 

那么rank()和dense_rank()有什么区别呢?
rank():  跳跃排序,如果有两个第一级时,接下来就是第三级。
dense_rank():  连续排序,如果有两个第一级时,接下来仍然是第二级

二、min()/max() over(partition by ...)

现在我们已经查询得到了部门最高/最低工资,客户需求又来了,查询雇员信息的同时算出雇员工资与部门最高/最低工资的差额。这个还是比较简单,在第一节的groupby语句的基础上进行修改如下:

-- 查询每位雇员信息的同时算出雇员工资与所属部门最高/最低员工工资的差额

  1. select ename 姓名, job 职业, hiredate 入职日期, e.deptno 部门, e.sal 工资, e.sal-me.min_sal 最低差额, me.max_sal-e.sal 最高差额  
  2.   from emp e, (select deptno, min(sal) min_sal, max(sal) max_sal from emp group by deptno) me    
  3.  where e.deptno = me.deptno order by e.deptno, e.sal; 

上面我们用到了min()和max(),前者求最小值,后者求最大值。如果这两个方法配合over(partition by ...)使用会是什么效果呢?大家看看下面的SQL语句:

  1. select ename 姓名, job 职业, hiredate 入职日期, deptno 部门,   
  2.      min(sal) over(partition by deptno) 部门最低工资,   
  3.      max(sal) over(partition by deptno) 部门最高工资   
  4.   from emp order by deptno, sal;    
  5.   
  6. select ename 姓名, job 职业, hiredate 入职日期, deptno 部门,   
  7.      nvl(sal - min(sal) over(partition by deptno), 0) 部门最低工资差额,   
  8.      nvl(max(sal) over(partition by deptno) - sal, 0) 部门最高工资差额  
  9.   from emp order by deptno, sal;  

三、lead()/lag() over(partition by ... order by ...)

中国人爱攀比,好面子,闻名世界。客户更是好这一口,在和最高/最低工资比较完之后还觉得不过瘾,这次就提出了一个比较变态的需求,计算个人工资与比自己高一位/低一位工资的差额。这个需求确实让我很是为难,在groupby语句中不知道应该怎么去实现。不过。。。。现在我们有了over(partition by ...),一切看起来是那么的简单。如下:

-- 计算个人工资与比自己高一位/低一位工资的差额

  1. select ename 姓名, job 职业, sal 工资, deptno 部门,    
  2.    lead(sal, 1, 0) over(partition by deptno order by sal)  比自己工资高的部门前一个,    
  3.    lag(sal, 1, 0) over(partition by deptno order by sal)  比自己工资低的部门后一个,    
  4.    nvl(lead(sal) over(partition by deptno order by sal) - sal, 0)  比自己工资高的部门前一个差额,     
  5.    nvl(sal - lag(sal) over(partition by deptno order by sal), 0)   比自己工资高的部门后一个差额  
  6.  from emp;     

 

看了上面的语句后,大家是否也会觉得虚惊一场呢(惊出一身冷汗后突然鸡冻起来,这样容易感冒)?我们还是来讲解一下上面用到的两个新方法吧。
lead(列名,n,m):  当前记录后面第n行记录的<列名>的值,没有则默认值为m;如果不带参数n,m,则查找当前记录后面第一行的记录<列名>的值,没有则默认值为null。
lag(列名,n,m):  当前记录前面第n行记录的<列名>的值,没有则默认值为m;如果不带参数n,m,则查找当前记录前面第一行的记录<列名>的值,没有则默认值为null。

下面再列举一些常用的方法在该语法中的应用(注:带order by子句的方法说明在使用该方法的时候必须要带order by):

  1. select ename 姓名, job 职业, sal 工资, deptno 部门,   
  2.     first_value(sal) over(partition by deptno) first_sal,   
  3.     last_value(sal) over(partition by deptno) last_sal,   
  4.     sum(sal) over(partition by deptno) 部门总工资,   
  5.     avg(sal) over(partition by deptno) 部门平均工资,   
  6.     count(1) over(partition by deptno) 部门总数,   
  7.     row_number() over(partition by deptno order by sal) 序号   
  8.  from emp;  

重要提示:大家在读完本片文章之后可能会有点误解,就是OVER (PARTITION BY ..)比GROUP BY更好,实际并非如此,前者不可能替代后者,而且在执行效率上前者也没有后者高,只是前者提供了更多的功能而已,所以希望大家在使用中要根据需求情况进行选择。

 

 

感谢 blogsheng 的博文

 

 

 

 

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值