今天来分享下将java开发的wordcount程序提交到spark集群上运行的步骤。
第一个步骤之前,先上传文本文件,spark.txt,然用命令hadoop fs -put spark.txt /spark.txt,即可。
第一:看整个代码视图
打开WordCountCluster.java源文件,修改此处代码:
第二步:
打好jar包,步骤是右击项目文件----RunAs--Run Configurations
照图填写,然后开始拷贝工程下的jar包,如图,注意是拷贝那个依赖jar包,不是第二个
然后将复制到桌面的这个jar包和另外一个文件WordCount.sh上传到