Hive的分组排序方法-row_number

这个方法总而言之就是帮助用户减少工作量

比如,如下结构:

CREATE TABLE user_order(
user_id int COMMENT '用户ID'
pro_id int COMMENT '产品ID',
value STRING COMMENT '价格' 
)

查出每个用户买的价值最高的两个用品,如果不用row_number费点时间也是可以写出来的,但是用row_number就比较快捷:

SELECT user_id,pro_id,value FROM (
SELECT user_id,pro_id,value,
row_number() over (PARTITION BY user_id OREDER BY value DESC) as flag
WHERE flag<=2
);

除Row_number外还有rank,dense_rank
以下是语法:
rank() over([partition by col1] order by col2)
dense_rank() over([partition by col1] order by col2)
row_number() over([partition by col1] order by col2)

功能差不多,但是有细微的差别
rank排序时出现相等的值时会有并列,即值相等的两条数据会有相同的序列值
row_number的排序不允许并列,即使两条记录的值相等也不会出现相等的排序值
dense_rank排序的值允许并列,但会跳跃的排序,像这样:1,1,3,4,5,5,7.

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值