Centos7分布式安装spark2.4.4

最新推荐文章于 2024-08-10 16:43:15 发布

人和心都在流浪

最新推荐文章于 2024-08-10 16:43:15 发布

阅读量448

点赞数

文章标签： spark 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jaly_007/article/details/105088470

版权

前置条件

3台虚拟机主机名： master, slave1, slave2;

默认已经安装和配置好jdk,scala等环境和下载好安装包。

所使用到的命令用蓝色表示

安装spark

将下载好的 spark-2.4.4-bin-hadoop2.7.tgz上传到虚拟机master，在安装包目录下使用命令

tar -zxvf spark-2.4.4-bin-hadoop2.7.tgz -C /usr/local/spark

解压到 /usr/local/spark目录下

cd /usr/local/spark //进入到解压目录

mv spark-2.4.4-bin-hadoop2.7 spark-2.4.4 //更改目录名称

cd spark-2.4.4 //进入spark-2.4.4目录

cp conf/spark-env.sh.template conf/spark-env.sh //复制conf目录下 spark-env.sh.template并命名为spark-env.sh

vim conf/spark-env.sh //修改conf目录下的 spark-env.sh,根据实际在末尾添加以下内容

cp conf/slaves.template conf/slaves //复制conf目录下 slaves.template并命名为 slaves

vim conf/slaves //修改conf目录下的 slaves, 根据实际在末尾添加以下内容

配置spark环境变量

vim /etc/profile //添加spark环境变量,如下图

source /etc/profile //更新环境变量

将master主机配置好的spark-2.4.4分发到slave1和slave2,在slave1和slave2主机执行以下命令

cd /usr/local/spark //如果没有该目录则创建

scp -r hadoop@master:/usr/local/spark/spark-2.4.4 . //将master主机上的spark-2.4.4拷贝到当前目录

同样配置spark的环境变量并更新环境变量

回到master主机

cd /usr/local/spark/spark-2.4.4/sbin //进入spark的安装目录下的 sbin

./start-all.sh //启动spark

在浏览器输入地址访问spark 的WEBUI,地址为spark-env.sh配置文件配置的ip和端口

出现以下页面即安装成功

人和心都在流浪

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Centos7分布式安装spark2.4.4

前置条件3台虚拟机主机名： master, slave1, slave2;默认已经安装和配置好jdk,scala等环境和下载好安装包。所使用到的命令用蓝色表示安装spark将下载好的 spark-2.4.4-bin-hadoop2.7.tgz上传到虚拟机master，在安装包目录下使用命令tar -zxvf spark-2.4.4-bin-hadoop2.7.tg...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。