用Hadoop中MapReduce进行TopN排序
数据格式:
10,3333,10,100
11,9321,1000,293
12,3881,701,20
13,6974,910,30
14,8888,11,39
订单ID 用户ID 资费 业务ID
在所有订单数据中计算出资费最高的N个订单,按降序排列
算法思想:在大量的数据中计算出资费最高的N个订单,为了节省资源和提高计算效率:在众多的Mapper的端,首先计算出自己的TopN,然后在...
原创
2018-10-06 22:02:19 ·
2773 阅读 ·
0 评论