Ubuntu上安装Anaconda

最新推荐文章于 2024-07-18 01:31:47 发布

ROBOT玲玉

最新推荐文章于 2024-07-18 01:31:47 发布

阅读量851

点赞数

分类专栏： spark 文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/malingyu/article/details/127447058

版权

spark 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

7. Anaconda

前提是要安装好hadoop集群+spark集群，参考地址Ubuntu安装hadoop集群 hive spark scala_ROBOT玲玉的博客-CSDN博客

7.1安装

下载Anaconda3-2021.05-Linux-x86_64.sh

下载地址：https://repo.anaconda.com/archive/index.html

执行命令：bash Anaconda3-2021.05-Linux-x86_64.sh -b

设置环境变量 vi /etc/profile，添加如下

#anaconda3

export PATH=/home/cyuser/anaconda3/bin:$PATH

export ANACONDA_PATH=/home/cyuser/anaconda3

export PYSPARK_DRIVER_PYTHON=$ANACONDA_PATH/bin/ipython

export PYSPARK_PYTHON=$ANACONDA_PATH/bin/python

生效环境变量source /etc/profile

注意：三个节点的服务器均要进行以上设置

验证设置是否成功

执行python –version

注意：有时环境变量设置不成功，也能显示python版本，要进入到如下目录，执行./python --version确定一下,版本是否一致

7.2测试

1. 修改默认的web地址，执行jupyter notebook --generate-config命令生成配置文件。

修改jupyter_notebook_config.py

添加如下：c.NotebookApp.ip='server1'

说明：其中server1表示的为服务器的名称

1. 新建文件夹~/pythonwork/ipynotebook，进入到该文件目录下，运行pyspark命令：

PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark

测试：访问地址http://server1:8888/

新建python文件

打开python文件，执行如下：

from pyspark.sql import SparkSession

spark = SparkSession.builder.master("yarn").enableHiveSupport().appName("Correlation").getOrCreate()

#日志输出级别

spark.sparkContext.setLogLevel("Error")

f=spark.sparkContext.textFile("hdfs://server1:9000/input/test.txt")

f.count()

spark.sparkContext.master

说明：输出local[*]表示此时的spark运行模式

1. 以yarn模式运行命令

PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" SPARK_HOME=/home/cyuser/spark-3.0.0-bin-hadoop3.2 HADOOP_CONF_DIR=/home/cyuser/hadoop3.1.0/etc/hadoop MASTER=yarn-client pyspark

再次执行上面的notebook中的python，内容，其中spark.sparkContext.master输出的为yarn，表示已经成功使用yarn模式执行。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Ubuntu上安装Anaconda

Anaconda python
复制链接

扫一扫

专栏目录

ROBOT玲玉 CSDN认证博客专家 CSDN认证企业博客

码龄11年

90: 原创

5万+: 周排名

2万+: 总排名

23万+: 访问

: 等级

2570: 积分

41: 粉丝

78: 获赞

33: 评论

339: 收藏

私信

关注

热门文章

分类专栏

.net 3篇
docbook 2篇
nginx 4篇
jenkins 4篇
node 4篇
jira 1篇
K8s 1篇
consul
網關 1篇
nodejs 1篇
opencv for android 6篇
android ndk
java 5篇
spark 6篇
python 10篇
spark，python 1篇
mysql 14篇
虚拟机 1篇
机器学习 1篇
Ubuntu 21篇
InfluxDB 1篇
docker 15篇
ros 3篇
c++ 9篇
eclipse 1篇
微服务 1篇

最新评论

PySpark 线性回归
§◇◆◇◆End.332: 数据集可以发一下吗
1.centos7 安装显卡驱动、cuda、cudnn
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
OptaPlanner Spring Boot Java快速启动
qq_15729315: 我最近也在看这个但是我如果想实现一下约束应该怎么处理呢 1、每个老师每天最多排4节课 2、每个班级的每个学科每天最多排2节课 3、每个班级每个学科的课程尽量平均分到每天（比如语文6节，应该是每天一节，有一天2节，而不是每天2节，3天就排完了）
Ubuntu mysql8.0忘记root密码
ROBOT玲玉: 先按照步骤1修改好文件之后，要重启mysql的
Ubuntu mysql8.0忘记root密码
NUAA_CX: 博主您好我在mysql -u root -p这一步之后输密码会报错： ERROR 2003 (HY000): Can't connect to MySQL server on 'localhost:3306' (111) 能方便解答一下疑惑吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。