1 分组求TopN
一、先看数据:
使用HiveSQL常用的方式为:
Select * from table,
row_number() over(partition by item order by score desc) rank
where rank<=2;
二、输出结果为:
三、解析:row_number()函数基于over对象分组、排序的记过,为每一行分组记录返回一个序号,该序号从1开始,依次递增,遇到新组则重新从1开始。也就是说,该函数计算的值表示每组内部排序后的顺序编号。
然后在语句中加入限制条件rank<=2来筛选具体选取top几。从最终的结果可以看出,语文成绩考试前两名的同学分别是