搭建spark单机版集群

wujiaen

已于 2024-04-25 17:31:08 修改

阅读量564

点赞数 6

文章标签： spark 大数据分布式

于 2024-04-25 17:23:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wujiaen/article/details/138195058

版权

本文详细介绍了如何在Linux上搭建Spark3.2.1的单机伪分布式集群，包括解压安装包、配置环境变量、启动集群、验证集群运行及使用SparkShell。

摘要由CSDN通过智能技术生成

搭建spark集群

解压Spark安装包

tar -zxf /opt/spark-3.2.1-bin-hadoop2.7.tgz -C /usr/local/

进入Spark安装目录的/bin目录，使用SparkPi计算Pi的值

cd /usr/local/spark-3.2.1-bin-hadoop2.7/bin/

./run-example SparkPi 2

如果执行时输出非常多的运行日志信息，输出结果找不到，就使用grep命令进行过滤（命令中的 2>&1 可以将所有的信息都输出到 stdout 中，否则由于输出日志的性质，还是会输出到屏幕中）

./bin/run-example SparkPi 2>&1 | grep "Pi is"

搭建单机伪分布式集群

将Spark安装包解压至Linux的/usr/local目录下

进入解压后的Spark安装目录的/conf目录下，复制spark-env.sh.template文件并重命名为spark-env.sh

cd /usr/local/spark-3.2.1-bin-hadoop2.7/conf/

cp spark-env.sh.template spark-env.sh

准备好java环境

启动Spark集群

cd /usr/local/spark-3.2.1-bin-hadoop2.7/sbin/

./start-all.sh

通过命令“jps”查看进程，如果既有Master进程又有Worker进程，那么说明Spark集群启动成功

启动spark-shell

cd /usr/local/spark-3.2.1-bin-hadoop2.7/

./bin/spark-shell

输入Scala命令检查是否能够进入Scala

scala

192.168.20.128:8080

http://master:8088

输入IP进入网页浏览

192.168.20.128:50070

关注

6
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
搭建spark单机版集群

搭建spark集群。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。