Hive分组排序取top(N)

案列:求每个班级每科成绩的第1名的学生。

样例数据如下:

这个是典型的分组,组内排序求top N的问题,可以利用rank函数来解决。语法如下:

rank() over([partition by col1] order by col2)  :排序时出现相等的值时会有相同的序列值,但会跳跃的排序,如:1,1,3,4,5,5,7

相同的功能的函数语法:
dense_rank() over([partition by col1] order by col2)  :排序时出现相等的值时会有相同的序列值,但不会跳跃的排序,如:1,1,2,3,4,4,5
row_number() over([partition by col1] order by col2) :排序时出现相等的值时会有不同的序列值,相同项按照顺序排序,如:1,2,3,4,5

 

建表:

create external table score (name string,subject string,score string,class string) row format delimited  fields terminated by ' ' location '/score'

 

hql:

select name,subject,score,class from (
    select name,subject,score,class,rank() over (partition by class,subject order by score desc) as rank 
    from score) score_tmp 
where rank=1;

结果如下:

  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值