jupyter notebook on spark 远程配置

最新推荐文章于 2024-07-20 13:23:35 发布

thinklog2018

最新推荐文章于 2024-07-20 13:23:35 发布

阅读量1.2k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/thinklog2018/article/details/79958751

版权

环境： server ： centos7 + annaconda2 + python2 + jupyter + spark+ hadoop

client ： windows 10 + 浏览器

在服务器上安装spark + hadoop 集群之后，需要通过pyspark 来使用spark 集群，spark系统自带的只有pyspark命令行交互方式。目标是使用jupyter notebook 来进行交互调试。因此需要在服务器上部署anaconda2，以通过pip 安装jupyter 。

部署jupyter 之后，一般使用jupyter notebook 命令会在本地启用一个服务，此时可以在客户端浏览器访问。

https://blog.csdn.net/xmo_jiao/article/details/72674687?utm_source=itdadao&utm_medium=referral

重点在于pyspark 与jupyter 的连接配置：

(1) 配置jupyter 的配置，确定地址、端口和不启用浏览器

jupyter notebook --generate-config
vi /home/hadoop/.jupyter/jupyter_notebook_config.py

增加如下几行：
c.NotebookApp.ip='192.168.12.7'
c.NotebookApp.open_browser=False
c.NotebookApp.port=8888

(2) /home/hadoop/.bashrc (启动spark的用户目录下配置)
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
export PATH="/anaconda2/bin:$PATH" （非必需）

source ./bashrc

(3) 启动pyspark

$SPAR_HOME/bin/pyspark

(4) 远程访问
浏览器访问 http://192.168.12.7:8888

   测试
    from pyspark import *
    print("pyspark remote access")

j

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

thinklog2018

CSDN认证博客专家 CSDN认证企业博客

码龄6年

47: 原创

2万+: 周排名

7万+: 总排名

9万+: 访问

: 等级

917: 积分

44: 粉丝

67: 获赞

15: 评论

121: 收藏

私信

关注

分类专栏

sanic 7篇
tornado 3篇
keepalived 1篇
Redis
机器学习笔记
python 5篇
linux 4篇
数据库 3篇
前端 5篇

最新评论

python asyncio 并发任务测试（1）
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
rsync同步文件时遇到的问题
最爱老詹LBJ: 两侧的rsync版本一定需要一致吗
element UI 中间内容自动填充满屏
Xeno Li: 感谢，只有这个可以解决，只设置el-container高度100%还是填不满的。但是直接设置absolutely其实也存在很大的问题，如果子组件不设置relative的话，会有显示错位等各种问题
nexus 配置pypi代理
风过留: 谢谢阿！哥！就是这个配置的时候去掉simple，自己连的时候加上simple是个什么原理呢？
python 实现syslog 服务器
香克斯哥: 接受很多个设备的syslog日志，会不会出现丢弃的现象，我发的syslog是udp包，总觉得日志多了python处理不完。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。