【hive排序函数-row_number()和rank()和dense_rank()的用法和区别】

【hive】排序函数

在实际的业务需求中,需要对一列数据进行排序。一般我们可以分为以下几种情况进行解决。
1、函数功能
常用的有row_number()、rank()和dense_rank()这三个是hive内置的分析函数:
(1)RANK() 排序相同时会重复,总数不会变
(2)DENSE_RANK() 排序相同时会重复,总数会减少
(3)ROW_NUMBER() 会根据顺序计算

这三个函数常常和开窗函数结合在一起使用

2、用法
对于一组下列数据,我们定义为表f_test:
在这里插入图片描述
我们用下面的sql去取:
在这里插入图片描述结果如下:
在这里插入图片描述可以看到,窗口函数over(partition by… )实现了对name这个主体进行分区排名。
(1)RANK() 排序相同时会重复,总数不会变,如:1,2,3,3,5…;
(2)DENSE_RANK() 排序相同时会重复,总数会减少,如:1,2,3,3,4…;
(3)ROW_NUMBER() 会根据顺序计算,如:1,2,3,4,5…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值