【hive】排序函数
在实际的业务需求中,需要对一列数据进行排序。一般我们可以分为以下几种情况进行解决。
1、函数功能
常用的有row_number()、rank()和dense_rank()这三个是hive内置的分析函数:
(1)RANK() 排序相同时会重复,总数不会变
(2)DENSE_RANK() 排序相同时会重复,总数会减少
(3)ROW_NUMBER() 会根据顺序计算
这三个函数常常和开窗函数结合在一起使用
2、用法
对于一组下列数据,我们定义为表f_test:
我们用下面的sql去取:
结果如下:
可以看到,窗口函数over(partition by… )实现了对name这个主体进行分区排名。
(1)RANK() 排序相同时会重复,总数不会变,如:1,2,3,3,5…;
(2)DENSE_RANK() 排序相同时会重复,总数会减少,如:1,2,3,3,4…;
(3)ROW_NUMBER() 会根据顺序计算,如:1,2,3,4,5…