从在自己的win7下面装好虚拟机,然后在虚拟机上面安装hadoop,然后再安装hadoop-eclipse插件,过去好像有一个星期了,之前装虚拟机和hadoop都没成功,上个星期解除了封印,一口气把hadoop学习前期的所有的东西都搞定了,接下来就是遥遥无期的hadoop之路。希望自己能坚持下去。
今天按着别人的思路在win7下面的eclipse里面敲了算是处女作的Map/Reduce程序,虽然很简单,但是自己还是一步一步的走通了,因为hadoop是安装在虚拟机上的,但是eclipse是在win7下面,所以在中间运行的时候会有一系列的错误,昨天晚上把遇到的问题百度的百度,问神的问神,烧香的烧香,基本上都解决了,现在能把程序跑起来,感觉自己的熬夜什么的都没有白费
下面把一个完整的Map/Reduce程序贴出来,算是一个开始,也是一个纪念嘛!
问题描述:
先上数据:
13599999999 10086
13899999999 120
13944444444 110
13722222222 110
18800000000 120
13722222222 10086
18944444444 10086
要求是把拨打过同一个电话的电话输出来比如:
110 13944444444,13722222222
接下来就是Map/Reduce函数,