Pycharm环境部署pyspark 步骤

最新推荐文章于 2024-03-31 14:40:09 发布

lxy6520177

最新推荐文章于 2024-03-31 14:40:09 发布

阅读量3.2k

点赞数 2

分类专栏：大数据搭建环境

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lxy6520177/article/details/93634488

版权

大数据搭建环境专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.下载并安装 spark-1.6.0-bin-hadoop2.4 ， hadoop-2.6.5 同时

添加相应的环境变量 HADOOP_HOME path 等

2. Pycharm 配置 configurations 设置环境变量 SPARK_HOME PYTHONPATH

3.把spark的python支持包复制到相应的路径中，即在安装python 中环境的Lib\site-packages目录下加入 py4j pyspark

PS ： py4j， pyspark 包来自 H:\spark-1.6.0-bin-hadoop2.4\python\lib

4. 完成后，运行第一个 pyspark 程序遇到以下两个错误

运行错误：TypeError: namedtuple() missing 3 required keyword-only arguments: 'verbose', 'rename', and 'module

解决方案：

Spark的版本是1.6.1，Python是用pycharm安装的，版本是3.6.

spark1.6不支持python3.6

所以只能下载 python 3.5 版本下载安装后请重新配置环境变量和运行py 文件的python interpreter

错误2 ：Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

解决方案：

hadoop-2.6.5\bin目录下缺少winutils.exe就会报缺少这个文件的错。

下载 winutils.exe 并加入 hadoop-2.6.5\bin目录下

最后程序即可成功运行。

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Pycharm环境部署pyspark 步骤

1.下载并安装 spark-1.6.0-bin-hadoop2.4， hadoop-2.6.5同时添加相应的环境变量 HADOOP_HOME path 等2. Pycharm 配置 configurations 设置环境变量 SPARK_HOME PYTHONPATH3.把spark的python支持包复制到相应的路径中，即在安装python 中环境的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。