03_jupyternotebook_windows设置pyspark

雪龙无敌

已于 2022-05-30 22:24:00 修改

阅读量324

点赞数

分类专栏： Python_hadoop_spark环境文章标签： spark hadoop java

于 2022-05-30 22:22:04 首次发布

本文链接：https://blog.csdn.net/u012338969/article/details/125055258

版权

Python_hadoop_spark环境专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文详细介绍了在Windows10环境下配置和使用pyspark的步骤，包括设置环境变量、安装findspark模块以及在jupyterLab或jupyterNotebook中启动pyspark。通过导入findspark并指定Spark的安装路径，然后创建SparkContext，成功实现了数据的并行处理。参考链接提供了一个完整的配置示例。

摘要由CSDN通过智能技术生成

01_windows10配置spark与pyspark
02_jupyterLab_windows设置pyspark
03_jupyternotebook_windows设置pyspark

1.配置环境变量

pyspark是在anaconda里面安装的，默认前面spark与hadoop，java路径已经配置，这里只需要配置pyspark

在这里插入图片描述

2．安装findspark

pip install findspark

在这里插入图片描述

3.调用pyspark

创建notebook并findspark
在新建的notebook里面运行以下代码。

import findspark

findspark.init('D:\\spark-3.1.3-bin-hadoop3.2')

findspark.find()

'D:\\spark-3.1.3-bin-hadoop3.2'

import pyspark
sc = pyspark.SparkContext()

tempData = [59,57.2,53.6,55.4,51.8,53.6,55.4]
# 这边就可以使用sc调用parallelize方法了
parTempData  = sc.parallelize(tempData)
parTempData.collect()

[59, 57.2, 53.6, 55.4, 51.8, 53.6, 55.4]

参考引用：

1.https://blog.csdn.net/sora_xu/article/details/104271734

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

雪龙无敌

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

centos7 在jupyter-notebook 使用pyspark

weixin_37353303的博客

10-24

840

发布文章昨天好不容易可以在centos上使用jupyter-notebook，但是在代码块写入import pyspark时却提示无模块，今天看到一篇博客，原来是没有配置/etc/profile中PYTHONPATH 使用jupyter-notebook --allow-root: http://blog.51cto.com/175779/204572...

window安装python3后怎么用pyspark_如何在Windows上的Jupyter Notebook中安装和运行PySpark...

weixin_42302418的博客

12-24

243

When I write PySpark code, I use Jupyter notebook to test my code before submitting a job on the cluster. In this post, I will show you how to install and run PySpark locally in Jupyter Notebook on Wi...

参与评论您还未登录，请先登录后发表或查看评论

Spark：JupyterNotebook整合PySpark开发环境

maoyuanming0806的博客

02-11

3305

详细介绍windows和linux环境安装部署Spark开发环境；详细演示jupyternotebook整合pyspark，方便在notebook上开发测试pyspark，完整演示流程

Win10下jupyterbook跑pyspark的详细配置方法（亲测有效）

码上就会

06-24

1830

需要准备JDK、Spark和Anaconda。一、JDK配置。注意：一定要下载并安装JDK1.8开头的版本。 1.安装完成后，在此电脑上右键单击，然后在弹出的菜单上选择“属性”，会打开控制面板主页。 2.在控制面板，单击高级系统设置，会打开系统属性选项卡 3.在系统属性选项卡上，单击环境变量，会弹出环境变量设置面板。 3.在环境变量设置面板中，新建或编辑JAVA_HOME系统变量，C:\JDK18241是我的JDK安装目录。完成后点击确定返回环境...

jupyter notebook + pyspark 环境搭建

诸葛建站

02-02

348

安装并启动jupyter 安装 Anaconda 后, 再安装 jupyter pip install jupyter 设置环境 ipython --ipython-dir= # override the default IPYTHONDIR directory, ~/.ipython/ by default ipython profile create foo # create the...

Jupyter notebook安装pyspark

qq_29632521的博客

02-23

2404

没安装前，百度了一下，看到好多安装时遇到版本冲突很严重的问题。但是看了pyspark官网的文档，发现可以直接用pypi直接安装，发现这个安装非常简单。 1、打开cmd 2、输入pip install pyspark 3、打开Jupyter Notebook，直接import pyspark done. ...

jupyter-Scala_2.11.11_kernel_Windows.zip

05-21

"jupyter-Scala_2.11.11_kernel_Windows.zip" 是专为Windows操作系统设计的Jupyter Notebook Scala内核安装包，允许用户在Jupyter环境中编写和运行Scala代码。 Scala是一种多范式编程语言，结合了面向对象和函数式...

maven工程下使用pyspark报错: key not found: _PYSPARK_DRIVER_CONN_INFO_PATH

fancychuan的博客

04-09

2197

使用IDEA，安装了python插件，在Maven工程中使用pyspark。执行下面这段代码的时候报错 # -*- encoding: utf-8 -*- """ Created on 16:07 2019/4/9 @author: fancyChuan @email: 1247375074@qq.com @desc: 向spark传递函数示例 """ from pyspark im...

spark指定python版本_pyspark-如何在Spark中设置驱动程序的python版本？

weixin_39634443的博客

11-26

1030

pyspark-如何在Spark中设置驱动程序的python版本？我使用的是spark 1.4.0-rc2，因此可以将Python 3与spark一起使用。如果将export PYSPARK_DRIVER_PYTHON=python3添加到我的.bashrc文件中，则可以与python 3交互运行spark。但是，如果我想在本地模式下运行独立程序，则会收到错误消息：Exception: Pyth...

window安装python3后怎么用pyspark_在 window 上安装 pyspark 并使用（集成 jupyter notebook）...

weixin_33023873的博客

12-24

278

参考了https://blog.csdn.net/m0_37937917/article/details/81159193预装环境：1、安装了Anaconda ，可以从清华镜像下载。2、环境安装了java，版本要7以及更高版本在前面的环境前提下开始下载安装pyspark下载 Apache Spark，访问 Apache Spark 官网下载1、选择一个 Spark 版本 (Choose a Sp...

PySpark安装+Jupyter Notebook配置（Ubuntu 18.06）

weixin_34248118的博客

09-05

465

学校一门Big Data Computing需要学习Spark in Python。这篇文章记录一下安装PySpark和Jupyter Notebook上运行Spark的步骤。 Prerequisite 我的系统是：Ubuntu 18.06 LTS 已经装好了python2和3(如果没有可以看看这个链接...

win10系统下jupyter notebook集成pyspark的关键点

Hackeryuan的博客

05-21

533

我前前后后花了两天时间才终于把环境调正确，以这篇文章叙述一下配置时的关键点。 pyspark-shell 有着所有交互式命令行的共同缺点，关掉后，已运行的代码也就随着一起销毁了，不能保存。说到兼具交互式命令行特点、代码保存功能、代码编译运行功能的软件，我们很自然就想到了jupyter notebook。事实上二代目jupyter lab也已经投入使用，但是我没有用它来集成，因为这是我遇到的第一个坑，目前jupyter lab只有高版本的Python才能下载(比如Python 3.8)，而Spark截止到目前

在win7下配置pyspark在jupyter notebook中使用的简单方法

xiaoliuzz的博客

11-27

2662

在win下配置好spark运行的必要条件后，想要在jupyter notebook上而不是shell里运行pyspark。只需要在windows环境变量中为pysprak在jupyter notebook中启动设置两个变量。 1、新建系统变量PYSPARK_DRIVER_PYTHON，值设为jupyter； 2、新建系统变量PYSPARK_DRIVER_PYTHON_OPTS，值设为noteb

如何在Windows上的Jupyter Notebook中安装和运行PySpark

xianglock的博客

12-24

583

https://www.cnblogs.com/chenxiangzhen/p/10706258.html

2. jupyter运行pyspark

ant的博客

01-07

5551

使用anaconda的jupyter notebook来运行pyspark 1. 安装anaconda（linux） 2. 配置 3. 本地模式运行pyspark 4. yarn运行pyspark 5. 遇到的问题 centos7默认python环境是2.7，我想要3.5的，使用anaconda配置python环境，anaconda还自带很多科学计算包，方便 1. 安...

怎么在windows本地配置pyspark和jupyter notebook开发环境

JayXu's Blog

02-11

1138

目录安装Scala安装spark安装Hadoop安装anaconda配置环境变量创建notebook并findspark 安装Scala 安装对应版本的scala 安装spark 到官网http://spark.apache.org/downloads.html选择相应版本，下载安装包。将安装包拷贝到C盘路径下，解压。后面安装的Hadoop版本需要跟Spark版本对应。安装Hadoop 到Ap...

在 window 上安装 pyspark 并使用（集成 jupyter notebook）

diandiao3054的博客

08-26

656

参考了https://blog.csdn.net/m0_37937917/article/details/81159193 预装环境： 1、安装了Anaconda ，可以从清华镜像下载。 2、环境安装了java，版本要7以及更高版本在前面的环境前提下开始下载安装pyspark 　下载 Apache Spark ，访问 Apache Spark 官网下载 1、选...

window 下 notebook 中的 pyspark安装

得道者

12-05

1335

背景：小组成员都习惯用python，但是有spark计算的需求，需要一个快速上手的环境https://www.cnblogs.com/zhw-080/archive/2016/08/05/5740580.html 这位朋友已经写得很详细，就是自己手写环境变量够不够细心的问题第一步：安装anaconda 试一下命令行启动，确保ipython从anaconda启动第二步：安装spark（需要

jyputer notebook 与pyspark在本地windows的环境配置

maketubu7的博客

04-12

683

1、下载anacond并安装，可以选择自动配置环境变量，也可以后面手动配置环境变量 2、http://spark.apache.org/downloads.html下载spark的对应版本 3、解压到一个指定的你想要存放的本地spark目录，自己创建，方便以后管理 4、设置各种环境变量，如下这里 java scala 的环境配置不必要但是还是需要配置一下，特别注意这里的 PYSP...

在Jupyter Notebook中PYSPARK_DRIVER_PYTHON: None