row_number()over(partition by col1 order by col2)表示根据col1分组,在分组内部根据col2排序,而此函数计算的值就表示每组内部排序后的顺序编号(组内连续的唯一的)。 与rownum的区别在于:使用rownum进行排序的时候是先对结果集加入伪劣rownum然后再进行排序,而row_number()在包含排序从句后是先排序再计算行号码。
一、oracle中rownum
用于从查询返回的行的编号,返回的第一行分配的是1,第二行是2,依此类推,这个伪字段可以用于限制查询返回的总行数,而且rownum不能以任何表的名称作为前缀。
1、rownum 对于等于某值的查询条件
如果希望找到学生表中第一条学生的信息,可以使用rownum=1作为条件。但是想找到学生表中第二条学生的信息,使用rownum=2结果查不到数据。因为rownum都是从1开始,但是1以上的自然数在rownum做等于判断是时认为都是false条件,所以无法查到rownum = n(n>1的自然数)。
SQL> select rownum,id,name from student where rownum=1; --有记录
SQL> select rownum,id,name from student where rownum =2; --无记录
2、rownum对于大于某值的查询条件
如果想找到从第二行记录以后的记录,当使用rownum>2是查不出记录的,可以使用以下的子查询方法来解决。注意子查询中的rownum必须要有别名,否则还是不会查出记录来,这是因为rownum不是某个表的列,如果不起别名的话,无法知道rownum是子查询的列还是主查询的列。
SQL>select * from(select rownum no ,id,name from student) where no>2; --有记录
SQL> select * from(select rownum,id,name from student)where rownum>2; --无记录
3、rownum对于小于某值的查询条件
如果想找到第三条记录以前的记录,当使用rownum<3是能得到两条记录的。显然rownum对于rownum<n((n>1的自然数)的条件认为是成立的,所以可以找到记录。
SQL> select rownum,id,name from student where rownum <3; --有记录
4、rownum和排序
Oracle中的rownum的是在取数据的时候产生的序号,所以想对指定排序的数据去指定的rowmun行数据就必须注意了。
SQL> select rownum ,id,name from student order by name;
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
3 200003 李三
2 200002 王二
1 200001 张一
4 200004 赵四
可以看出,rownum并不是按照name列来生成的序号。系统是按照记录插入时的顺序给记录排的号,rowid也是顺序分配的。为了解决这个问题,必须使用子查询
SQL> select rownum ,id,name from (select * from student order by name);
ROWNUM ID NAME
---------- ------ ---------------------------------------------------
1 200003 李三
2 200002 王二
3 200001 张一
4 200004 赵四
二、oracle中row_number() over()
1、row_number() over (order by col_1[,col_2 ...])
按照col_1[,col_2 ...]排序,返回排序后的结果集,并且为每一行返回一个不相同的值。eg.
a).使用row_number()函数进行编号,如
SQL>select email,customerID, ROW_NUMBER() over(order by psd) as rows from QT_Customer
原理:先按psd进行排序,排序完后,给每条数据进行编号。
b).在订单中按价格的升序进行排序,并给每条记录进行排序代码如下:
SQL>select DID,customerID,totalPrice,ROW_NUMBER() over(order by totalPrice) as rows from OP_Order
2、row_number() over (partition by col_n[,col_m ...] order by col_1[,col_2 ...])
先按照col_n[,col_m ...进行分组,再在每个分组中按照col_1[,col_2 ...]进行排序(升序),最后返回排好序后的结果集
eg.统计每一个客户最近下的订单是第几次下的订单。
SQL>with tabs as
(
select ROW_NUMBER() over(partition by customerID order by totalPrice) as rows,customerID,totalPrice, DID from OP_Order
)
select MAX(rows) as '下单次数',customerID from tabs group by customerID
3、在使用over等开窗函数时,over里头的分组及排序的执行晚于“where,group by,order by”的执行。
SQL>select ROW_NUMBER() over(partition by customerID order by insDT) as rows, customerID,totalPrice, DID
from OP_Order where insDT>'2011-07-22'
以上代码是先执行where子句,执行完后,再给每一条记录进行编号。
三、rownum和row_number() over()的具体应用场景
如果是在分页的场合下,我们首推row_number()over()函数。
我们以员工表为例子:
--查询(薪水从高到底的)员工信息
SQL>SELECT rownum,e.* FROM emp e ORDER BY sal;
结果:
--问题:为什么Order by以后行号(ROWNUM)是乱的。
--原因:先分配了行号(ROWNUM),再根据sal排序。
分页:
<1>第一页数据
SELECT ROWNUM ,t.* FROM (
SELECT e.* FROM emp e ORDER BY e.sal DESC ) t
WHERE ROWNUM between 1 AND 3
结果:
<2>第二页数据
SELECT ROWNUM ,t.* FROM (
SELECT e.* FROM emp e ORDER BY e.sal DESC ) t
WHERE ROWNUM between 4 AND 6
结果:
结果集为空!我们不难发现,ROWNUM必须从1开始!这是由rownum的特性(没有1就不会有2,没有3……以此类推下去)
问题:那么可能会有疑问,如何正确显示第二页的数据呢?
有两种方法:
第一种:以上的sql语句再嵌套一个SELECT语句
SELECT k.* FROM (
SELECT ROWNUM r,t.* FROM (
SELECT e.* FROM emp e ORDER BY e.sal DESC ) t
) k
WHERE r between 4 AND 6
结果:
第二种:使用ROW_NUMBER()OVER()函数
select t2.*
from (select t.*, row_number() over(order by t.sal desc) orderNumber
from emp t
) t2
where orderNumber between 4 and 6;
结果:
两者在效率上没有任何差异,如果是对索引列进行排序的时候,row_number()over()函数有明显优势。
以上资料整理自网上!