MapReduce基本使用——wordcount
背景:hadoop集群,确保HDFS组件能使用。
搭建过程可参考Ubuntu系统下安装Hadoop集群安装。
MapReduce提供了自带的Example,wordcount的功能是统计单词的数量,主要步骤如下:
1.在文件系统创建wordcount/input文件夹;
hdfs dfs -mkdir /wordcount/input
2.将内容为下图的input.txt文件上传到刚刚创建的文件夹;
I love runoob
I like runoob
I love hadoop
I like hadoop
hdfs dfs -put input.txt /wordcount/input
3.运行wordcount程序(share/hadoop/mapreduce);
hadoop jar hadoop-mapreduce-examples-2.10.1.jar wordcount /wordcount/input /wordcount/output
4.显示运行结果,如图共有两个文件;
hadoop fs -ls /wordcount/output
5.显示文件内容;