首先感谢 http://my.oschina.net/BreathL/blog/75112 的作者,把楼主的代码拿过来,造了些数据,跑了起来。
其中TextPair自定义数据类型,在代码中用的时候种种类型相关的异常,最后不行,把输入/输出串做Text处理。
Hadoop版本1.2.1。
下载链接:http://download.csdn.net/detail/lxb_champagne/6339609
但是实际使用应该还有很多工作要做,稍加臆测,以新浪微博为例:大V×大V数据的处理,毕业院校/公司/兴趣爱好的协调过滤,地理位置信息的推荐等等。