Spark集群模式安装配置

最新推荐文章于 2024-02-28 22:34:15 发布

不需要講太多、

最新推荐文章于 2024-02-28 22:34:15 发布

阅读量329

点赞数 1

文章标签： spark 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_54354021/article/details/129961462

版权

一，上传spark到Linux并解压文件到相应目录

进行解压解压命令格式：tar -zxvf 压缩包名 /目录

tar -zxvf spark-2.4.5-bin-hadoop2.7.tgz

解压后修改名字

 mv spark-2.4.5-bin-hadoop2.7/ spark-standalone

二，配置环境变量：

vi ~/.bashrc

添加配置：

export SPARK_HOME=/usr/soft/spark-standalone
export PATH=$PATH:$SPARK_HOME/bin

最后source：

source ~/.bashrc

三，修改配置文件：

（1）进入解压缩路径（spark-standalone）的conf目录，修改slaves.template文件名为slaves：

mv slaves.template slaves

（2）修改slaves文件，添加work节点：

vim slaves

在slaves添加自己另外两台虚拟机的主机名（每个人的主机名不一样）

（3）修改spark-env.sh.template文件名为spark-env.sh：

mv spark-env.sh.template spark-env.sh

（4）修改spark-env.sh文件，添加JAVA_HOME环境变量和集群对应的master节点：

vim spark-env.sh

在spark-env.sh文件中添加：

export JAVA_HOME=/opt/tool/jdk/jdk1.8
SPARK_MASTER_HOST=master
SPARK_MASTER_PORT=7077

注意：JAVA_HOME是你自己jdk目录

SPARK_MASTER_HOST=你自己的主机名

注意：7077端口，相当于hadoop3内部通信的8020端口，此处的端口需要确认自己的Hadoop配置。

（5）分发spark-standalone目录

要在另外两台虚拟机创建与主虚拟机一样的目录然后分发到一样的目录下

分发格式：

 scp -r spark-standalone/ node1:/目录

 scp -r spark-standalone/ node2:/目录

五，启动集群：

（1）执行以下命令：

sbin/start-all.sh

（2）查看三台服务器运行进程

master：

node1：

node2：

（3）查看Master资源监控Web UI界面:http://master:8080（如果加载不出来可以把主机名改成IP地址）

不需要講太多、

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark集群模式安装配置

spark集群模式（spark-standalone）安装配置步骤
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。