1.创建maven 工程。
2.编写程序并配置pom.xml。
3.执行mvn命令。
mvn clean:清理
mvn install: 下载依赖包等。
mvn package: 打包成jar. 在target中可以找到。
4.启动hadoop.
sh start-dfs.sh
sh start-yarn.sh
5. 删除输出文件,往HDFS中添加输入文件。
(注意上一次执行的输出文件若不删除,下一次执行会中途抛错)
hdfs dfs -rm -r hdfs://ip:port/user/username/out //删除旧的输出文件