问题一:运行测试代码wordcount.py时,报错:Java gateway process exited before sending its port number
解决方法:
点击 Environment variables, 点击“+”,添加 PYTHONPATH=D:\spark-2.2.1\python(具体视自己安装的spark目录为准)
问题二:在PyCharm中运行测试代码wordcount.py时,出现连接不到问题,报错:WARN StandaloneAppClient$ClientEndpoint: Failed to connect to master ......
报这个错的情况有很多种,分析可能是sc = SparkContext("spark://admin.localdomain:7077", "WordCountApp")出现问题,因为我是直接搬书上的测试代码。改为自己的主机名sc = SparkContext("spark://node1:7077", "WordCountApp")后,同样报错。
解决方法:
经过排查因为通过 SFTP 把本地文件远程发布到虚拟机的设置没有自动上传文件,也就是说pycharm的测试文件wordcount.py没有上传到虚拟机指定位置或者修改后的wordcount.py文件没有自动同步到虚拟机,需要自己重新上传。