1.安装路径/opt/hadoop,启动Hadoop
2.创建输入数据文件“in-自己姓名全拼.txt”
vim in-brisy.txt
任意输入英文内容,按下 Esc 键,输入 :wq 进行保存
3.HDFS上创建/input路径:
hdfs dfs -mkdir /input
4.上传“in-自己姓名全拼.txt”到HDFS的/input路径下。如果不是第一次运行wordcount程序,需要删除前次自动生成的HDFS的/output路径:
hdfs dfs -put /root/in-brisy.txt /input
5.运行Hadoop自带的jar包和wordcount程序,注意程序路径要与自己的Hadoop安装路径一致:
hadoop jar /opt/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.10.2.jar wordcount /input /output
6、运行成功之后查看HDFS的/output/part-r-00000文件里的词频统计结果:
hdfs dfs -cat /output/part-r-00000