- 博客(1)
- 资源 (15)
- 收藏
- 关注
转载 hive中分组取前N个值的实现
背景假设有一个学生各门课的成绩的表单,应用hive取出每科成绩前100名的学生成绩。这个就是典型在分组取Top N的需求。 解决思路对于取出每科成绩前100名的学生成绩,针对学生成绩表,根据学科,成绩做order by排序,然后对排序后的成绩,执行自定义函数row_number(),必须带一个或者多个列参数,如ROW_NUMBER(col1, ....),它
2014-07-25 16:56:55 1235
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人