执行wordcount程序(词频统计)
- 创建目录,保存MapReduce的输入文件
hadoop fs -mkdir /wcinput
- 创建目录,保存MapReduce的输出文件
hadoop fs -mkdir /wcoutput
因为Hadoop要求输出文件夹不能存在,所以这只是空文件夹,在执行时再确定输出文件夹,如/wcoutput/output1
- 创建一个文本文件,并上传到保存输入文件的文件夹中
- 运行WordCount程序
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /wcinput /wcoutput/output1
- 本地查看结果(截取部分)
- 远程查看结果
初学,犯了很蠢的错误,没有文件就开始运行程序,词频统计没有词怎么统计嘛