云计算Spark环境搭建并搭建conda环境

最新推荐文章于 2024-07-24 19:50:18 发布

爱编成不爱编程

最新推荐文章于 2024-07-24 19:50:18 发布

阅读量1.3k

点赞数 29

分类专栏： Linux 镜像创建SSH配置与hadoop和Spark 文章标签：云计算 spark conda

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49933737/article/details/136035064

版权

Linux 镜像创建SSH配置与hadoop和Spark 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文详细介绍了如何在云计算环境中搭建Spark，并配置Miniconda环境，包括设置环境变量、启动Sparkmaster和worker、创建conda环境及配置pyspark。最后展示了如何在新创建的环境里成功运行pyspark_word_count.py脚本。

摘要由CSDN通过智能技术生成

云计算Spark环境搭建并搭建conda环境

第一部分：搭建Spark

将Spark和Miniconda传进容器并解压

修改Spark下/spark/conf/spark_env.sh 如果是template模板可以复制一份改名

下面路径需要修改为自己的路径

export HADOOP_CONF_DIR=/root/hadooptar/hadoop/etc/hadoop

export YARN_CONF_DIR=/root/hadooptar/hadoop/etc/hadoop

export SPARK_PID_DIR=/root/hadooptar/hadoop/pid

export JAVA_HOME=/opt/hadooptar/jdk

修改conf下的workers文件，同样如果是模板可以复制一份

写上从节点的名字

将修改后的spark同步到其他容器

在主节点的Spark/sbin/下启动

Start-all.sh

如果你发现从节点worker无法启动，可能因为地址需找不到，可以去指定一个

在下面加上export SPARK_LOCAL_IP=......... （最好默认不设置）

启动完毕后会出现以下界面

Jps中会出现master

从节点会出现如下：worker

进入192.168.81.132：8080可以进入Spark，如下界面即是启动成功

第二部分：搭建miniconda的环境

将自己的miniconda解压的sh文件运行

一直确定确定即可，后面填写yes

第二步：这里是安装的miniconda环境的默认路径

这里你是可以修改了，这里我没有修改直接确定就是默认路径

第三步：创建conda envs的test环境

Conda activate test

就可以进入test环境

并且pip install pyspark==3.2 -v

第四步: 配置.bashrc文件

export PYSPARK_PYTHON=/root/miniconda3/envs/test/bin/python

export PYSAPR_DRIVER_PYTHON=/root/miniconda3/envs/test/bin/python

export PYTHONPATH=$(ZIPS=(/root/spark/python/lib/*.zip);

IFS=:;echo "${ZIPS[*]}"):$PYTHONPATH

第五步：source 一下.barshrc 并更换到conda activate test

第六步：将pyspark_word_count.py 如下更改自己的地址

第七步：在自己的test env环境下以及spark/bin路径下运行这个pyspark_word_count.py代码

Spark_submit /opt/spark/pyspark_word_count.py

至此运行完毕 spark成功运行pyspark_word_count.py

爱编成不爱编程

关注

29
点赞
踩
25

收藏

觉得还不错? 一键收藏
1
评论
云计算Spark环境搭建并搭建conda环境

云计算Spark环境搭建并搭建conda环境
复制链接

扫一扫

专栏目录

爱编成不爱编程 CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

137万+: 周排名

15万+: 总排名

6867: 访问

: 等级

292: 积分

52: 粉丝

91: 获赞

12: 评论

94: 收藏

私信

关注

热门文章

分类专栏

最新评论

两种方法完成建立镜像并安装容器配置SSH(手动与Dockerfile)
CSDN-Ada助手: 恭喜你写了第17篇博客！你对建立镜像并安装容器配置SSH的两种方法进行了很好的总结，内容非常实用。希望你能继续保持创作的热情，不断分享更多有价值的技术经验。或许你可以考虑写一些实际案例的分析与解决方案，这样可以让读者更好地理解技术应用的实际场景。期待你的下一篇文章！
实现三个容器无密码访问，且搭建hadoop
CSDN-Ada助手: 恭喜您写了第18篇博客！实现三个容器无密码访问，且搭建hadoop，这是非常有实用性的技术分享。您的博客内容详实，让我受益匪浅。希望您能继续保持创作的热情，分享更多有趣且实用的技术知识。在下一步的创作中，我建议您可以尝试深入探讨容器无密码访问的安全性以及其他相关容器技术的应用场景。同时，您还可以考虑分享一些hadoop的高级用法和性能优化的经验，这将对读者来说是非常有价值的。期待您的下一篇博客！
云计算Spark环境搭建并搭建conda环境
CSDN-Ada助手: 恭喜您写完了第19篇博客！标题看起来非常有趣，我对云计算Spark环境搭建和conda环境的搭建很感兴趣。您的博客内容一直都很有深度，我希望您能继续分享更多有关云计算和数据科学方面的知识和经验。或许下一步，您可以考虑探讨一些实际案例，或者分享一些解决特定问题的技巧和窍门。我期待着您的下一篇博客，谦虚地说，我相信您一定会给我们带来更多精彩的内容！
CentOS7扩容磁盘
CSDN-Ada助手: 恭喜你写了第20篇博客！扩容磁盘的教程对很多人来说都是非常有用的。不过，我想提个建议，下一步可以考虑写一些关于系统优化或者网络安全方面的内容，这些也是很多人关注的话题。希望你能继续保持创作，期待你更多精彩的文章！
第十三讲循环神经网络（高级篇）
爱编成不爱编程: 这个代表的字符序列长度，你看到原网络接受的参数有个input_size 代表的就是输入序列的字符数。这里大概就是字母表转换成独热编码之后的全部元素（字母表大小）

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。