使用Hadoop运行WorldCount示例
上一节中我们搭建好了Hadoop的运行环境,虽然还没开始学习Hadoop各个组件的框架原理,但是我先来通过hadoop运行自带的worldcount示例来熟悉一下它的操作流程。
1.首先找到hadoop自带worldcount jar包示例的路径:
2.准备工作,需要创建输入输出路径以及上传的文件:
(1)创建目录
hadoop fs -mkdir -p /data/wordcount
hadoop fs -mkdir -p /output/
(2)新建输入文件inputWord:
vim /usr/inputWord
将本地准备的输入文件上传到hdfs中:
hadoop fs -put /usr/inputWord /data/wordcount
上传成功后可以通过命令查看hdfs里的文件
hadoop fs -ls /data/wordcount
hadoop fs -text /data/wordcount/inputWord
3.准备工作做完之后就可以运行实例了,执行命令
hadoop jar hadoop-mapreduce-examples-2.8.0.jar wordcount /data/wordcount /output/wordcountresult
可以看到控制台输出信息如下:
4.查看执行结果
hadoop fs -text /output/wordcountresult/part-r-00000
以上hadoop自带的wordcount实例运行结束