Spark3 Standalone模式高可用分布式集群搭建(HA模式)

最新推荐文章于 2023-12-27 08:34:27 发布

最笨的羊羊

最新推荐文章于 2023-12-27 08:34:27 发布

阅读量548

点赞数

分类专栏：大数据文章标签： Spark3.0.1 高可用分布式集群搭建 HA模式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhengzaifeidelushang/article/details/109589327

版权

大数据专栏收录该内容

528 篇文章 539 订阅 ¥49.90 ¥99.00

订阅专栏

Spark3 Standalone模式高可用分布式集群搭建

一、修改配置文件
二、启动Zookeeper集群
三、启动Hadoope集群
四、启动Spark集群
五、查看进程
六、浏览器查看Spark集群
七、测试Master节点故障自动切换
八、Spark应用程序实例

搭建Spark3 Standalone模式(非高可用模式)参考下面这篇博客：
Spark3 Standalone模式分布式集群搭建

安装部署Spark3 on Yarn分布式集群(YARN模式)参考下面这篇博客：
Spark3 on Yarn分布式集群安装部署(YARN模式)

Spark Standalone集群是Master-Slaves架构的集群模式，当Worker调度出现问题的时候会自动弹性容错，可以将出错的Task调度到其他Worker执行，但存在着Master单点故障的问题。
这里基于zookeeper的Standby Masters（Standby Master with zookeeper）实现高可用。基本原理是通过zookeeper来选举一个Master，其他的Master处于Standby状态。将spark集群连接到同一个Zookeeper实例并启动多个Master，利用zookeeper提供的选举和状态保存功能，使一个Master被选举为active状态，其他Master处于Standby状态。如果现任Master死去，另一个Master会通过选举产生，并恢复到旧的Master状态，然后恢复调度，整个过程可能要1-2分钟。

一、修改配置文件

在Spark Standalone配置的基础上，修改/moudle/spark-3.0.1/conf/spark-env.sh配置文件，

了解本专栏

最笨的羊羊

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
Spark3 Standalone模式高可用分布式集群搭建(HA模式)

十三、实现Spark集群的高可用搭建Spark Standalone集群是Master-Slaves架构的集群模式，和大部分的Master-Slaves结构集群一样，存在着Master单点故障的问题。这里基于zookeeper的Standby Masters（Standby Master with zookeeper）实现高可用。基本原理是通过zookeeper来选举一个Master，其他的Master处于Standby状态。将spark集群连接到同一个Zookeeper实例并启动多个Master，利用z
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

最笨的羊羊 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。