脑裂(split brain):描述的是私有网络心跳出现故障的时候,而每个节点都正常运行,这时侯每个节点都认为其他的节点宕机了,自己应该获得集群的控制权,这种状况就是脑裂。脑裂了某些原因导致心跳线无法连接,这时候每个NODE都是独立的个体了,突然心跳线恢复了,然后节点们互相争主权。
在脑裂检查阶段Reconfig Manager会找出那些没有Network Heartbeat而有Disk Heartbeat的节点,并通过Network Heartbeat(如果可能的话)和Disk Heartbeat的信息来计算所有竞争子集群(subcluster)内的节点数目,并依据以下2种因素决定哪个子集群应当存活下去:
1. 拥有最多节点数目的子集群(Sub-cluster with largest number of Nodes)
2. 若子集群内数目相等则最低节点号的子集群(Sub-cluster with lowest node number)把其他子集群踢出,举例来说在一个2节点的RAC环境中总是1号节点会获胜。
只有2个节点的时候,投票算法就失效了,number较小的1节点通过voting disk向2号节点发起驱逐
不过个人的理解为: 第一个启动的节点,就是主节点(不一定是节点1),两个节点时,主节点驱逐另一个节点
在脑裂检查阶段Reconfig Manager会找出那些没有Network Heartbeat而有Disk Heartbeat的节点,并通过Network Heartbeat(如果可能的话)和Disk Heartbeat的信息来计算所有竞争子集群(subcluster)内的节点数目,并依据以下2种因素决定哪个子集群应当存活下去:
1. 拥有最多节点数目的子集群(Sub-cluster with largest number of Nodes)
2. 若子集群内数目相等则最低节点号的子集群(Sub-cluster with lowest node number)把其他子集群踢出,举例来说在一个2节点的RAC环境中总是1号节点会获胜。
只有2个节点的时候,投票算法就失效了,number较小的1节点通过voting disk向2号节点发起驱逐
不过个人的理解为: 第一个启动的节点,就是主节点(不一定是节点1),两个节点时,主节点驱逐另一个节点
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/30126024/viewspace-2112832/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/30126024/viewspace-2112832/