目录
文章目录
脑裂(Split Brain)
在 HA(高可用)系统中,当联系主、从节点之间的 “心跳线路” 断开时,本来作为一个整体、动作协调的 HA 系统,就分裂成为两个独立的节点,即两者都认为自己是 Master。导致两个 “Master” 本能的争抢资源、互相冲突,继而导致严重的后果。
对于无状态的 HA 系统而言,无所谓脑裂的存在,但对有状态的 HA 系统而言,必须要严格防止脑裂的产生。
脑裂的原因
产生脑裂的原因,归根结底是 “心跳线路” 的网络故障,通常有以下几种情况:
- 硬件损坏:网卡、网线、交换机损坏等。
- 软件配置错误:IP 冲突、防火墙不放行、软件 BUG 等。
防止脑裂的办法
实际上,双节点的主从 HA 架构很难做到 100% 防脑裂的效果,升级为 3 冗余架构才能从根源上解决问题。
-
心跳链路冗余:物理/虚拟网卡 Bond。
-
设置第三方仲裁:根据实际情况设置 “冲裁机构”&