MapReduce 学习日志之我的MapReduce程序学习
将一批电话通信清单,记录了用户A拨打用户B的记录,需要做一个倒排索引,记录拨打给用户B的所有用户A。如
原有的txt 为:
首先,我们应该把源文件传到Hdfs上,然后将原始数据进行分割,将被叫作为KEY,主叫作为Value,将拨打相同被叫的主叫号码汇总起来输出到HDFS。程序如下:
package com.xxs;
import java.io.IOException;
im
原创
2015-11-03 21:42:48 ·
491 阅读 ·
0 评论