window安装python3后怎么用pyspark_Windows上的PyCharm 远程连接调试pyspark

最新推荐文章于 2021-05-12 15:46:46 发布

胡老师聊自考

最新推荐文章于 2021-05-12 15:46:46 发布

阅读量209

点赞数

文章标签： window安装python3后怎么用pyspark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29437633/article/details/113688380

版权

在实验室配置了一个Spark集群，传统的方法就是在Windows本地开发项目，完了后打包，然后上传到Linux服务器上，最后执行spark-submit 。但是在实际开发用还是感觉用IDE比较好，于是找到了Pycharm远程连接Linux服务器开发Spark项目的方法。

1.设置环境变量

在Linux中/usr/local/spark/spark-2.2.0-bin-hadoop2.7/python/lib 目录下py4j 包添加在系统环境变量中，注意源码包的版本问题，要与下面安装的py4j 的版本一致才行。

vim /etc/profile

#添加环境变量

export PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.10.4-src.zip

#生效

source /etc/profile

2.远程服务器同步配置

2.1在Linux上安装py4j

我的集群(Centos 7)上原本是Python2.7 ，后来是工作需要改为了Python3.6.4 。在Centos 7 安装py4j 首先要安装pip3 ，这里采用Yum安装的方式。

在使用yum安装的时候会出现无法使用yum的错误，根据提示信息将文件最上面的改为python2.7即可。

yum install pip3

pip3 install py4j

06b40a77b6ee

image.png

2.2配置Deployment

首先我们需要配置PyCharm通服务器的代码同步&#

最低0.47元/天解锁文章

胡老师聊自考

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
window安装python3后怎么用pyspark_Windows上的PyCharm 远程连接调试pyspark

在实验室配置了一个Spark集群，传统的方法就是在Windows本地开发项目，完了后打包，然后上传到Linux服务器上，最后执行spark-submit 。但是在实际开发用还是感觉用IDE比较好，于是找到了Pycharm远程连接Linux服务器开发Spark项目的方法。1.设置环境变量在Linux中/usr/local/spark/spark-2.2.0-bin-hadoop2.7/python/...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。