主要有四个步骤:
一、 在hdfs分布式文件系统 中创建两个文件夹,分别存放输入、输出数据
1、 bin/hadoop fs –mkdir –p/data/wordcount 创建的输入数据目录
2、 bin/hadoop fs –mkdir –p/output/ 创建的输出数据目录
二、 将要测试的文件上传到hdfs文件系统的输入数据目录
1、 从本地上传到HDFS中
bin/hadoop fs –put 本地文件路径 HDFS系统输入数据路径
2、 查看上传到hdfs中的文件情况:
bin/hadoop fs –ls /data/wordcount
3、 查看上传到HDFS中的文件:
bin/hadoop fs –text /data/wordcount/
三、 运行wordcount例子(运行jar包)
Bin/hadoop jar 本地文件jar包的路径 wordcount 输入数据在HDFS文件系统中的路径 输出数据在HDFS文件系统中的路径
四、 查看结果
bin/hadoop fs –text /output/wordcount/part–r-00000