hive内group by取第一条数据，Hive中row_number的使用

最新推荐文章于 2021-11-06 14:39:13 发布

VIP文章 njit_peiyuan

最新推荐文章于 2021-11-06 14:39:13 发布

阅读量5.4k

点赞数

文章标签：大数据数据库

1、hive的分组和组内排序---语法

语法：
row_number() over (partition by 字段a order by 计算项b desc ) rank

rank是排序的别名
partition by：类似hive的建表，分区的意思；
order by ：排序，默认是升序，加desc降序；
这里按字段a分区，对计算项b进行降序排序

2、hive的分组和组内排序 --- 实例

要取top10品牌，各品牌的top10渠道，各品牌的top10渠道中各渠道的top10档期

1、取top10品牌

select “品牌” , sum/count/其他() as num from "table_name" order by num desc limit 10;

2、取top10品牌下各品牌的top10渠道

select a.* from (select "品牌","渠道",sum/count() as num, row_number () over (partition by "品牌" order by num desc) rank from “table_name” where 品牌限制条件 group by “品牌”,“渠道” ) a having a.rank <= 10;

3、取

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
hive内group by取第一条数据，Hive中row_number的使用

1、hive的分组和组内排序---语法语法：row_number() over (partition by 字段a order by 计算项b desc ) rankrank是排序的别名partition by：类似hive的建表，分区的意思；order by ：排序，默认是升序，加desc降序；这里按字段a分区，对计算项b进行降序排序2...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。