基于Standalone模式部署Spark集群

最新推荐文章于 2022-06-07 08:19:54 发布

小虎啊~

最新推荐文章于 2022-06-07 08:19:54 发布

阅读量173

点赞数 1

分类专栏：大数据文章标签： spark

本文链接：https://blog.csdn.net/weixin_45626815/article/details/109015894

版权

11 篇文章 1 订阅

订阅专栏

在清华大学开源网站镜像站选择适合自己版本的Spark；

我的个人资料目录为： /usr/husun

tar -zxvf /usr/husun/spark-2.4.7-bin-hadoop2.7.tgz -C /usr/spark

进入spark的安装目录，输入：

ls | grep spark

出现以下显示则解压成功： spark解压缩成功

cd /usr/spark/spark-2.4.7-bin-hadoop2.7/conf/

注意：
用 ll 或 ls 命令查看该目录下的文件列表，后缀名都是".template"，这是官方默认的文件命名方式。如果此时启动Spark，则文件不会生效。

用以下命令将这些配置文件改名为Spark可以识别的形式：

for i in *.template; do mv ${i} ${i%.*}; done

修改slaves文件

vi  slaves

先删除第一行"localhost"，添加以下内容：（确保每一个主机名独一行）

master
slave1
slave2

 vi spark-env.sh

在文档末尾加入

export SPARK_MASTER_HOST=master
export SPARK_MASTER_PORT=7077

进入Spark下的sbin目录，

cd /usr/spark/spark-2.4.7-bin-hadoop2.7/sbin/

修改spark-config.sh文件

vi spark-config.sh

修改JAVA_HOME参数为自己的jdk安装目录

export JAVA_HOME=/usr/java/jdk1.8.0_241

scp -r /usr/spark/spark-2.4.7-bin-hadoop2.7/ slave1 /usr/spark/
scp -r /usr/spark/spark-2.4.7-bin-hadoop2.7/ slave2 /usr/spark/

进入/etc/profile目录

cd  etc/profile

在文档最后加入以下两行代码

export SPARK_HOME=/usr/spark/spark-2.4.7-bin-hadoop2.7
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

生效文件

source /etc/profile

进入第一台虚拟机的Spark安装目录之下，启动所有Spark节点的相关服务：

cd /usr/spark/spark-2.4.7-bin-hadoop2.7/
sbin/start-all.sh

如果没有设置Windows中的hosts文件，则可以用主机IP

http://master:8080

如果出现这样的画面，恭喜你，成功了！

基于Standalone模式部署Spark集群成功

关注

专栏目录