StandAlone - HA高可用模式
为什么要使用HA高可用模式
Spark StandAlone集群是Master - Slaves架构的集群模式,和大部分的Master - Slaves结构集群一样,存在着Master单点故障问题。
提问:如何解决这个单点故障的问题?
Spark提供了两种解决方案
- 基于文件系统的单点恢复(Single-Node Recovery with Local File System)
- 基于Zookeeper的Standby Masters(Standby Masters with Zookeeper)
注意:
基于文件系统的方案只能用于开发或测试环境,而基于Zookeeper的方案,可以用于生产环境
HA方案在使用上也很简单,只需要先启动zookeeper集群,然后在不同节点上启动Master即可。
配置HA
- 先停止Spark集群
/export/servers/spark-2.2.0-bin-2.6.0-cdh5.14.0/sbin/stop-all.sh
- 在node01上配置
vim /export/servers/spark-2.2.0-bin-2.6.0-cdh5.14.0/conf/spark-env,sh
- 注释掉Master配置