1 分组求TopN
一、先看数据:

使用HiveSQL常用的方式为:
Select * from table,
row_number() over(partition by item order by score desc) rank
where rank<=2;
二、输出结果为:

三、解析:row_number()函数基于over对象分组、排序的记过,为每一行分组记录返回一个序号,该序号从1开始,依次递增,遇到新组则重新从1开始。也就是说,该函数计算的值表示每组内部排序后的顺序编号。
然后在语句中加入限制条件rank<=2来筛选具体选取top几。从最终的结果可以看出,语文成绩考试前两名的同学分别是

本文介绍了如何使用HiveSQL进行分组求TopN、行转列/列转行的操作。通过row_number()函数实现分组后的TopN选择,利用case when和explode函数完成行列转换。同时,详细解析了每个操作的实现原理和步骤,帮助读者理解HiveSQL中的高级用法。
订阅专栏 解锁全文
812

被折叠的 条评论
为什么被折叠?



