第一种写法:
row_number() over(partition by 一个或多个分组列 order by 一个或多个排序列 asc/desc) as 别名
//如果不写asc/desc的话,默认为asc
第二种写法:
row_number() over(distribute by 一个或多个分组列 sort by 一个或多个排序列 asc/desc) as 别名
在使用 row_number() over()函数时候,
over()里头的分组以及排序的执行晚于 where 、group by、 order by 的执行。
rn:为别名,代表每个分组中每行数据的所在序号ID,可用于根据rn序号ID直接获取出每个分组中的第一条数据
例子:按name分组,按日期排序
select
*,
row_number() over(distribute by name sort by date desc) rn
from
table_A
;
常使用该函数进行去重
SELECT
*
FROM
(
SELECT
a.*,
row_number() over(partition by name order by create_time desc) as rn
FROM
table_A a
)
WHERE
rn=1
;
解释:按name分组,然后按数据创建时间降序排序,最后去rn=1就是取最新的一条数据,这也是一种去重的办法。