ubuntu搭建jupyter notebook以及jupyter与spark的链接

本文详细介绍了在Ubuntu系统中搭建Jupyter Notebook的过程,并实现了Jupyter与Spark的链接。从安装Python3、Jupyter Notebook开始,到配置Spark环境变量,最后通过findspark测试链接,全程步骤清晰,适合初学者快速上手。

搭建jupyter notebook

安装python3

更新软件包

sudo apt-get update

在这里插入图片描述
安装 python3,默认 python3 将安装最新版本,一般Ubuntu都自带python在 /usr/local目录下

sudo apt-get install python3

在这里插入图片描述
安装python第三方安装工具:

sudo apt-get install python3-pip

在这里插入图片描述
查看python3版本信息

python3 -V

在这里插入图片描述

安装jupyter notebook

下载jupyter notebook

pip3 install jupyter -i https://pypi.tuna.tsinghua.edu.cn/simple

在这里插入图片描述
运行 jupyter notebook

jupyter notebook

在这里插入图片描述
使用find命令找出 jupyter

find -name jupyter

在这里插入图片描述
将上述路径添加到环境变件中

sudo gedit ~/.bashrc

在这里插入图片描述

export PATH=~/.local/bin:${PATH}

使环境变量生效

source ~/.bashrc

在这里插入图片描述
运行 jupyter notebook

jupyter notebook

在这里插入图片描述
Jupyter Notebook是基于网页的用于交互计算的应用程序。可以直接在网页上新建文件进行编写
在这里插入图片描述

jupyter与spark的链接

修改配置文件

运行pyspark

cd /usr/local/spark/bin
./pyspark

直接运行pyspark可能会出现以下错误:
因为没有配置Spark python的环境变量

pyspark:行 45: python: 未找到命令
 env: "python": 没有那个文件或目录

在这里插入图片描述
解决办法:
添加python相关环境变量

gedit ~/.bashrc
export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.7-src.zip:$PYTHONPATH
export PYSPARK_PYTHON=python3

在这里插入图片描述
在这里插入图片描述
注意:py4j-0.10.7-src.zip要到/usr/local/spark/python/lib目录查看是否是这个名称。不同版本的py4j的名称会有差别。

保存后,让环境变量生效

source ~/.bashrc

再次运行pyspark

./pyspark

在这里插入图片描述退出pyspark

exit()

在这里插入图片描述

链接jupyter与spark

安装 findspark

pip3 install findspark

在这里插入图片描述
测试 jupyter 是否成功连接 spark

import findspark
findspark.init("/usr/local/spark") # 指明SPARK_HOME
import pyspark
from pyspark import SparkContext, SparkConf
print("hello spark")

成功链接,则会输出 “hello spark”
在这里插入图片描述
至此,ubuntu搭建jupyter notebook以及jupyter与spark的链接就结束了,如果博客中有问题,欢迎各位大神们指点迷津

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值