本小白在跑WordCount时,主要参照林子雨老师的博客进行的,在自己这边做的时候因为有一些不同,遇到了一些问题,在此记录一下,有错的地方烦请指正。
林老师博客地址: http://dblab.xmu.edu.cn/blog/1311-2/
首先在提交文件到hdfs上时,软件不仅仅要有访问文件的权限,而且文件所在的路径的所有文件夹都要有访问的权限,不然找不到所需要的文件。
用intellij写代码打jar包时,最后一行要有sc.stop(),不然程序会一直运行,直到将命令行关闭。
在本地运行,文件地址为本地地址,在hdfs上运行,文件地址就是hdfs上的文件地址了。
参考:https://blog.csdn.net/dai451954706/article/details/50086295 提交jar包时报:Invalid signature file digest for Manifest main attributes,要将jar包中签名文件删除:
zip -d <jar file name>.jar META-INF/*.RSA META-INF/*.DSA META-INF/*.SF
还有一个注意点:用intellij写代码时,
不要在External Library处直接鼠标右键删除jar包,“你删除了就真的删除了”,不要问我时怎么知道的。。。