1.先在虚拟机创建一个自己将要和pycharm映射的文件夹:mkdir /opt/pycharm,这个文件夹是之后pycharm上传代码文件的目录
2.打开pycharm,新建项目,设置存放路径F:\pythonProject
3.打开设置,进入Python解释器设置,点击添加
4.主机为你的ip,用户名为虚拟机的用户名,接着下一步密码,接着按下图操作。
输入你的虚拟机密码连接
找到你在虚拟机安装Python的解析器路径
添加文件映射
之后点击确定完成即可。
5.pycharm新建一个代码文件测试运行:新建test的Python文件,由于我的是2021版本的pycharm,当新建文件之后自动上传至hadoop,需要手动上传的看下图二
如果报错,可能是文件权限不够,做以下命令:sudo chown -R root:root pycharm/
6.上传完成之后,到hadoop的/opt/pycharm目录下测试运行。结果输出hello,word。
使用spark-submit提交命令:spark-submit test.py