spark-submit提交Python程序，使用python zip环境

最新推荐文章于 2024-05-06 13:27:33 发布

阿斌001

最新推荐文章于 2024-05-06 13:27:33 发布

阅读量2.1k

点赞数

分类专栏： spark 文章标签： pycharm spark ide

本文链接：https://blog.csdn.net/m0_37264741/article/details/122860231

版权

spark 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

## yarn client hdfs文件
spark-submit  \
--master yarn \
--deploy-mode cluster \
--driver-memory 1g \
--num-executors 3 \
--executor-memory 1g \
--executor-cores 1 \
--archives hdfs://hadoop102:8020/user/xxx/python_zips/pyspark_env.zip#my_env \
--conf spark.pyspark.driver.python=./my_env/pyspark_env/bin/python3.8 \
--conf spark.pyspark.python=./my_env/pyspark_env/bin/python3.8 \
/tmp/pycharm_project_455/helloworld.py

--archives hdfs://hadoop102:8020/user/xxx/python_zips/pyspark_env.zip#my_env （一定要有#my_env，分发到yarn 容器中解压生成的目录名）

python环境的zip包上传到hdfs的用户目录下

zip -r pyspark_env.zip pyspark_env/

hdfs://hadoop102:8020/user/xxx/python_zips/pyspark_env.zip

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿斌001

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
spark-submit提交Python程序，使用python zip环境

## yarn client hdfs文件spark-submit \--master yarn \--deploy-mode cluster \--driver-memory 1g \--num-executors 3 \--executor-memory 1g \--executor-cores 1 \--archives hdfs://hadoop102:8020/user/xxx/python_zips/pyspark_env.zip#my_env \--conf spark..
复制链接

扫一扫