1、row_number() over()排序功能:
(1) row_number() over()分组排序功能:
在使用 row_number() over()函数时候,over()里头的分组以及排序的执行晚于 where group by order by 的执行。
partition by 用于给结果集分组 ,如果没有指定那么它把整个结果集作为一个分组,它和聚合函数不同的地方在于它能够返回一个分组中的多条记录,而聚合函数一般只有一个反映统计值的记录。
例如:employee,根据部门分组排序。
1
2
3
4
5
6
7
8
9
10
<strong>
SELECT
empno,WORKDEPT,SALARY, Row_Number() OVER (partition
by
workdept
ORDER
BY
salary
desc
) rank
FROM
employee</strong>
--------------------------------------
A00 152750 1
A00 66500 2
A00 49250 3
A00 46500 4
A00 39250 5
B01 94250 1
C01 98250 1
C01 73800 2
(2)对查询结果进行排序:(无分组)
1
2
3
4
5
6
7
8
9
10
11
<strong>
SELECT
empno,WORKDEPT,SALARY, Row_Number() OVER (
ORDER
BY
salary
desc
) rank
FROM
employee </strong>
--------------------------------------
A00 152750 1
C01 98250 2
D21 96170 3
B01 94250 4
E11 89750 5
E21 86150 6
E01 80175 7
C01 73800 8
D11 72250 9
row_number() over()和rownum差不多,功能更强一点(可以在各个分组内从1开时排序).
2、rank() over()是跳跃排序,有两个第二名时接下来就是第四名(同样是在各个分组内).
1
2
3
4
5
6
7
8
9
10
11
<strong>
select
workdept,salary,rank() over(partition
by
workdept
order
by
salary)
as
dense_rank_order
from
emp
order
by
workdept; </strong>
------------------
A00 39250 1
A00 46500 2
A00 49250 3
A00 66500 4
A00 152750 5
B01 94250 1
C01 68420 1
C01 68420 1
C01 73800 3
3、dense_rank() over()是连续排序,有两个第二名时仍然跟着第三名。相比之下row_number是没有重复值的 .
1
2
3
4
5
6
7
8
9
10
11
12
<strong>
select
workdept,salary,dense_rank() over(partition
by
workdept
order
by
salary)
as
dense_rank_order
from
emp
order
by
workdept;</strong>
------------------
A00 39250 1
A00 46500 2
A00 49250 3
A00 66500 4
A00 152750 5
B01 94250 1
C01 68420 1
C01 68420 1
C01 73800 2
C01 98250 3
使用ROW_NUMBER删除重复数据 ---假设表TAB中有a,b,c三列,可以使用下列语句删除a,b,c都相同的重复行。
1
2
DELETE
FROM
(
select
year
,QUARTER,RESULTS,row_number() over(partition
by
YEAR
,QUARTER,RESULTS
order
by
YEAR
,QUARTER,RESULTS)
AS
ROW_NO
FROM
SALE )
WHERE
ROW_NO>1
最后在执行hive 语句时出错, 出现错误:
FAILED: ParseException line 22:7 extraneous input '10' expecting EOF near ''
有看到解释说是,原因是:
sql语句中多了分号。。。
执行脚本时需要在sql后面添加分号,但是调用jdbc执行sql语句时,不可以在语句用分号结束。
但依旧没有解决问题。
转自:https://www.cnblogs.com/alsf/p/6344197.html