1 WordCount 程序运行方法
现在有四个小的文本
文本内容分别是
把这四个文件所在的文件夹 input 放在 HDFS 中
运行 Hadoop 自带的 WordCount 程序
hadoop jar /usr/local/etc/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep /input /output '[a-z]+'
查看生成的结果
2 程序运行的原理(MapReduce工作过程)
map 节点
reduce 节点
3 参考资料
1、MapReduce原理与设计思想
http://www.cnblogs.com/wuyudong/p/mapreduce-principle.html
2、第一个MapReduce程序——WordCount
http://blog.csdn.net/lisonglisonglisong/article/details/47125319
3、Hadoop集群(第6期)_WordCount运行详解
https://www.cnblogs.com/xia520pi/archive/2012/05/16/2504205.html
4、Java笔记—Hadoop 2.7.1下WordCount程序详解
http://blog.csdn.net/gulu_gulu_jp/article/details/51298164