分布式系统中经典的网络问题
假设三个节点node1,node2,node3组成的集群:
1. node1网路出现问题与外界隔离,node2与node3会重新选举master,如node2成为了新master,此时会更新cluster state;
2. node1自己组成集群后,也会更新cluster state;
结果便是同一个集群拥有两个master,且维护不同的cluster state, 网络恢复后无法选择正确的master;
ES的解决措施
ES集群中只能有一个主节点,master节点通过集群中所有节点选举产生,可以被选举的节点成为master-eligible节点,配置如下: -node.master: true
设置可被选举结点数大于等于指定值(这个值一般为可被选举值的一半+1)时才可以选举master,如三个节点可以设置为2:
discovery.zen.minimum_master_nodes=2
可以保证至少有两个节点正常的情况下选举主节点,避免了脑裂发生;
ps:ES可以搭建两个节点的集群,但官方不推荐的原因
通过以上的分析其实我们可以知道,两个节点间发生网络隔离,如果将discovery.zen.minimum_master_nodes
设置为1,那么依然会发生脑裂问题;
设置为2,则ES不会选举主节点向外提供服务,会造成严重后果;