Spark环境搭建之standalone模式安装

最新推荐文章于 2022-10-11 22:51:28 发布

森屿旅人996

最新推荐文章于 2022-10-11 22:51:28 发布

阅读量438

点赞数

分类专栏： Spark 文章标签：大数据 hadoop spark centos linux

本文链接：https://blog.csdn.net/weixin_46086427/article/details/107298599

版权

9 篇文章 0 订阅

订阅专栏

Standalone模式: 即构建一个由Master+Slave构成的Spark集群，Spark运行在集群中。

spark安装包下载地址官网下载链接
1.上传并解压spark安装包,改文件夹名称，便于使用

[hadoop@hrbu30 ~]$ tar -zxvf spark-2.4.6-bin-hadoop2.7.tgz -C /opt/wdp/
[hadoop@hrbu30 wdp]$ mv spark-2.4.6-bin-hadoop2.7 spark

在这里插入图片描述
2.进入spark安装目录下的conf文件夹,修改配置文件名称

[hadoop@hrbu30 wdp]$ cd spark/conf/
[hadoop@hrbu30 conf]$ mv slaves.template slaves
[hadoop@hrbu30 conf]$ mv spark-env.sh.template spark-env.sh

3.修改slaves文件,添加集群中服务器的主机名

[hadoop@hrbu30 conf]$ vi slaves

在这里插入图片描述
4.修改spark-env.sh文件

[hadoop@hrbu30 conf]$ vi spark-env.sh

在这里插入图片描述
5.修改sbin目录下的spark-config.sh,添加jdk的环境变量（如果不添加，启动spark的时候会报“JAVA_HOME not set” 异常）

6.分发spark包到集群中的每一个节点

[hadoop@hrbu30 wdp]$ xsync spark/

7.启动spark,查看进程，这样spark的standlone模式就安装完了

[hadoop@hrbu30 spark]$ sbin/start-all.sh
[hadoop@hrbu30 spark]$ xcall jps

在这里插入图片描述

关注

专栏目录