Hive经排序后查询前N条记录

本文介绍了在Hive中如何进行排序并查询每个分组的前N条记录。通过使用`row_number() over (partition by ... order by ...)`函数,可以实现按指定字段分区并排序,从而获取每个分组内的TopN结果。文中给出了多个实例,分别展示了不同分组条件下的排序和取前N条记录的操作。
摘要由CSDN通过智能技术生成

基础知识:

hive的排序查询的语法是

row_number() over (partition by 字段a order by 计算项b desc ) rank 

--这里rank是别名

partition by:类似hive的建表,分区的意思;

order by :排序,默认是升序,加desc降序;

这里按字段a分区,对计算项b进行降序排序

row_number() 可以给每一行一个行号,而后面的over是给点行号的条件

参考

hive 分组+组内排序 , 求topN - 幽灵工作室 - 博客频道 - CSDN.NET  http://blog.csdn.net/u010670689/article/details/49337137

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值