pycharm 配置 spark环境

最新推荐文章于 2024-07-06 02:41:11 发布

ROBOT玲玉

最新推荐文章于 2024-07-06 02:41:11 发布

阅读量1k

点赞数 1

文章标签： python spark

原文链接：https://www.freesion.com/article/2375834130/

版权

文章详细介绍了如何一步步配置Spark开发环境，包括安装JDK和Hadoop，设置环境变量，安装Spark，特别强调了在Windows环境下配置winutils，以及在PyCharm中配置Spark环境，最后通过测试代码确认环境配置成功。

摘要由CSDN通过智能技术生成

1.安装好JDK：

JDK所有人肯定都装了，这里就不细说明了。

2.安装Hadoop并配置环境变量：
hadoop下载地址：Index of /apache/hadoop/common

解压hadoop-2.8.3.tar.gz特定路径，如：D:\hadoop-2.8.3
添加系统变量HADOOP_HOME：D:\hadoop-2.8.3
在系统变量PATH中添加：D:\hadoop-2.8.3\bin
安装组件winutils：将winutils中对应的hadoop版本中的bin替换自己hadoop安装目录下的bin

3.Spark环境变量配置：

说明：spark是基于hadoop之上的，运行过程中会调用相关hadoop库，如果没配置相关hadoop运行环境，会提示相关出错信息，虽然也不影响运行。

下载对应hadoop版本的spark：Apache Download Mirrors。本人使用的是hadoop2.8.3版本，spark是spark-2.4.5-bin-hadoop2.7。可以使用

解压文件到：E:\dju_softwares\DSJ_gz\spark-2.4.5-bin-hadoop2.7
添加PATH值：E:\dju_softwares\DSJ_gz\spark-2.4.5-bin-hadoop2.7\bin
新建系统变量SPARK_HOME：E:\dju_softwares\DSJ_gz\spark-2.4.5-bin-hadoop2.7

5.在CMD中运行pyspark：

出现以下图说明安装配置正常

6.在pycharm中配置spark

打开PyCharm，创建一个Project。然后选择“Run” ->“Edit Configurations”–>点击+创建新的python Configurations

选择 “Environment variables” 增加SPARK_HOME目录与PYTHONPATH目录。

SPARK_HOME:Spark安装目录
PYTHONPATH:Spark安装目录下的Python目录下的lib下的py4j-0.10.7-src.zip

选择 File->setting->你的project->project structure

右上角Add content root添加：py4j-some-version.zip和pyspark.zip的路径，这两个文件都在spark-2.4.5-bin-hadoop2.7\python\lib文件夹中。

7.测试环境是否配置成功：

import os
import sys
os.environ['SPARK_HOME'] = "D:\adasoftware\spark"
sys.path.append("D:\adasoftware\spark\python")
try:
from pyspark import SparkContext
from pyspark import SparkConf
print("Successfully imported Spark Modules")
except ImportError as e:
print("Can not import Spark Modules", e)
sys.exit(1)

运行代码提示成功导入模块，及spark环境搭建成功。

版权声明：本文为csdnliu123原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：PyCharm：Django框架搭建Spark开发环境_IT change the world的博客-CSDN博客

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄12年

90
原创

82
点赞

349
收藏

42
粉丝

关注

私信

热门文章

分类专栏

.net 3篇
docbook 2篇
nginx 4篇
jenkins 4篇
node 4篇
jira 1篇
K8s 1篇
consul
網關 1篇
nodejs 1篇
opencv for android 6篇
android ndk
java 5篇
spark 6篇
python 10篇
spark，python 1篇
mysql 14篇
虚拟机 1篇
机器学习 1篇
Ubuntu 21篇
InfluxDB 1篇
docker 15篇
ros 3篇
c++ 9篇
eclipse 1篇
微服务 1篇

最新评论

OptaPlanner Spring Boot Java快速启动
csdn_jiangl: [code=java] private Constraint DayAtMostTwoSamClassedConstraint(ConstraintFactory constraintFactory) { QuadConstraintStream<String, String, Integer, Integer> stream = constraintFactory.forEach(Lesson.class) .groupBy(new Function<Lesson, String>() { @Override public String apply(Lesson lesson) { return lesson.getStudentGroup(); } }, new Function<Lesson, String>() { @Override public String apply(Lesson lesson) { return lesson.getSubject(); } }, new Function<Lesson, Integer>() { @Override public Integer apply(Lesson lesson) { return lesson.getTimeSlot().getDayOfWeek(); } }, ConstraintCollectors.count()); return stream.penalize(HardSoftScore.ONE_SOFT, [/code]
OptaPlanner Spring Boot Java快速启动
csdn_jiangl: [code=java] private Constraint DayAtMostFourClassesConstraint(ConstraintFactory constraintFactory) { // 每个老师每天最多排4节课 TriConstraintStream<String, Integer, Integer> stream = constraintFactory.forEach(Lesson.class) .groupBy(new Function<Lesson, String>() { @Override public String apply(Lesson lesson) { return lesson.getTeacher(); } }, new Function<Lesson, Integer>() { @Override public Integer apply(Lesson lesson) { return lesson.getTimeSlot().getDayOfWeek(); } }, ConstraintCollectors.count()); return stream.penalize(HardSoftScore.ONE_HARD, new ToIntTriFunction<String, Integer, Integer>() { @Override public int applyAsInt(String teacher, Integer dayOfWeek, Integer count) { return count > 4 ? 1 : 0;// r [/code]
PySpark 线性回归
§◇◆◇◆End.332: 数据集可以发一下吗
1.centos7 安装显卡驱动、cuda、cudnn
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
OptaPlanner Spring Boot Java快速启动
qq_15729315: 我最近也在看这个但是我如果想实现一下约束应该怎么处理呢 1、每个老师每天最多排4节课 2、每个班级的每个学科每天最多排2节课 3、每个班级每个学科的课程尽量平均分到每天（比如语文6节，应该是每天一节，有一天2节，而不是每天2节，3天就排完了）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。