Spark HA 搭建

最新推荐文章于 2023-04-09 19:00:24 发布

philpy_used

最新推荐文章于 2023-04-09 19:00:24 发布

阅读量225

点赞数

分类专栏： Hadoop Spark Linux 文章标签： linux zookeeper hadoop spark 大数据

本文链接：https://blog.csdn.net/qq_43613793/article/details/115398328

版权

Linux 同时被 3 个专栏收录

35 篇文章 0 订阅

订阅专栏

Hadoop

30 篇文章 0 订阅

订阅专栏

Spark

3 篇文章 0 订阅

订阅专栏

修改`spark-env.sh`配置文件

export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=centos01:2181,centos02:2181,centos03:2181 -Dspark.deploy.zookeeper.dir=/spark"

spark.deploy.zookeeper.url：指定ZooKeeper集群各节点的主机名与端口
spark.deploy.zookeeper.dir：指定Spark在ZooKeeper中注册的znode节点名称

同步配置文件

scp conf/spark-env.sh hadoop@centos02:/opt/modules/spark-2.4.0-bin-hadoop2.7/conf/
scp conf/spark-env.sh hadoop@centos03:/opt/modules/spark-2.4.0-bin-hadoop2.7/conf/

启动ZooKeeper集群

在三台服务器上：

bin/zkServer.sh start

启动Spark集群

centos01：

sbin/start-all.sh

centos02：

sbin/start-all.sh

查看各节点进程

在这里插入图片描述

测试Spark HA

进入Spark Web界面查看两个Master的状态，此时centos01节点Master的状态为ALIVE，（即active活动状态）：
在这里插入图片描述

centos02节点Master的状态为STANDBY状态，（即备用状态）：

在这里插入图片描述

使用 kill -9 命令杀掉centos01节点的Master进程，稍等几秒后多次刷centos02节点的Web界面，发现Master的状态由STANDBY状态变为RECOVERING（恢复，该状态持续的时间非常短暂），最后变为ALIVE：
在这里插入图片描述

此时，若需要连接Spark集群执行操作，--master参数的连接地址需要改为spark://centos02:7077：

bin/spark-shell --master spark://centos02:7077

在这里插入图片描述

philpy_used

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Spark HA 搭建

修改spark-env.sh配置文件

同步配置文件

启动ZooKeeper集群

启动Spark集群

查看各节点进程

测试Spark HA

修改`spark-env.sh`配置文件