在win10上为pycharm配置spark

本文档详细介绍了在Windows 10系统上为PyCharm配置Spark的过程,包括安装JDK、Scala、Spark,设置环境变量,以及在PyCharm中创建项目并配置环境变量的步骤,旨在解决配置过程中的常见问题。
摘要由CSDN通过智能技术生成

最近实验室给了我一个基于spark的大数据项目,光是在Linux系统上搭建起一个spark的local版本就有不少坑(版本、环境变量...)。另外,实验室之前的代码都是用python写的,所以我就上手了一下pyspark在python上的配置,emmm,我看网上的教程,大部分都没有解决我的问题,在经过不断的尝试后,终于配置起来了。下面我就来总结一下, 既是给我自己做一个备份,也是给大家填一下坑。

一、包的安装以及环境配置:

1.jdk:我的版本是:1.8.0_191 我的安装路径是:C:\Program Files\Java\jdk1.8.0_191

然后需要配置环境变量:

在“系统变量”中添加“JAVA_HOME",在”值“中输入jdk文件夹的路径:

在”系统变量“中的”path“中添加jdk以及jre的”bin“文件夹的路径:

安装成功的标志是:

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PyCharm是一款功能强大的Python集成开发环境(IDE),可以方便地配置和管理Spark运行环境。下面是配置PyCharmSpark的步骤: 1. 安装Java Development Kit(JDK):首先,确保你已经安装了JDK。你可以从Oracle官网下载并安装适合你操作系统的JDK版本。 2. 下载Spark:访问Apache Spark官网(https://spark.apache.org/downloads.html),选择适合你的Spark版本并下载。 3. 解压Spark:将下载的Spark压缩包解压到你想要安装的目录。 4. 配置环境变量:将Spark的bin目录添加到系统的环境变量中。在Windows系统中,可以在系统属性中的"高级系统设置"中设置环境变量;在Linux或Mac系统中,可以编辑.bashrc或.bash_profile文件,并添加以下行: ``` export SPARK_HOME=/path/to/spark export PATH=$SPARK_HOME/bin:$PATH ``` 5. 打开PyCharm:启动PyCharm,并创建一个新的Python项目。 6. 配置PyCharmSpark:在PyCharm的菜单栏中,选择"File" -> "Settings"。 7. 在设置窗口中,选择"Project" -> "Project Interpreter"。 8. 点击右上角的齿轮图标,选择"Add..."。 9. 在弹出的窗口中,选择"System Interpreter",然后点击"OK"。 10. 在解释器路径中,选择你的Python解释器。 11. 在"Environment variables"部分,点击"+"按钮添加一个新的环境变量。 12. 设置环境变量名为"PYSPARK_PYTHON",值为你的Python解释器的路径。 13. 点击"OK"保存设置。 现在,你已经成功配置PyCharmSpark运行环境。你可以在PyCharm中编写和运行Spark应用程序了。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值