PyCharm 基于Anaconda配置PySpark

本文档详细介绍了如何在PyCharm中配置PySpark开发环境,包括安装Anaconda、下载PyCharm和Spark,配置Python环境,解决SPARK_HOME问题,以及处理运行时可能遇到的错误。
摘要由CSDN通过智能技术生成
  1. 开发PySpark 所需准备环境

  1. 安装python环境

下载安装Anaconda。详细见文档。

  1. 安装PyCharm

下载安装PyCharm。

  1. 官网下载Spark安装包

由于PyCharm开发spark 需要本地Spark环境,所以要在官网中下载Spark安装包到本地(这里我们下载Spark1.6版本)。

  1. 进入Spark官网,找到对应的Spark版本下载。

  1. 将下载好的安装包解压到本地某个路径(路径中不要有空格和中文)

  2. 将解压的路径中的…spark….\python\lib下的以下两个压缩包解压

解压后:

注意:

★py4j是一个用 Python和Java编写的库。通过Py4J,Python程序能够动态访问Java虚拟机中的Java对象,Java程序也能够回调Python对象。

★pyspark 是 Spark 为 Python 开发者提供的 API。

  1. PyCharm开发Spark应用程序

使用PyCharm开发Spark应用环境需要配置Python环境,我们使用的Spark1.6版本,Spark2.1以下版本不支持python3.6版本,所以我们使用兼容性比较好的Python3.5版本,需要在PyCharm中配置。具体如下:

  1. 打开PyCharm创建新的项目

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值