参考文献:
Bully Algorithm
港中文课件
Bully Algorithm Example
Bully Algorithm(霸道选举算法)
Bully algorithm
Leader Election的合理性
在分布式场景下,有一个leader来进行决策,让其他followers跟随leader行动是合理的。因为这样子可以将一个复杂度是 O ( N 2 ) O(N^2) O(N2)的distributed场景(可以想象有 N N N个节点的全连接拓扑结构)变成一个 1 对 N 1对N 1对N的场景。Leader Election要解决的问题就是一旦leader死了,剩余节点是否能尽快选举出一个新的leader。
我们能否用互斥算法mutual exclusion(ME)来解决leader election问题呢?因为在muex中每次也只有一个人拿到锁,类比起来就是承担leader角色。但实际答案是不行,主要是以下两点:
- ME算法不能解决 failed leader
- ME算法拒绝饿死starvation,而leader election中一个leader只要不fail可以一直存在,这违反了ME有限等待的前提。
Bully Algorithm
霸道选举算法是一种分布式选举算法,每次都会选出存活的进程中ID最大的候选者。
课件中对其场景进行如下定义:
也给出了一个很好的例子来让大家理解->Bully Algorithm Example
时间复杂度
最差的情况为
O
(
N
2
)
O(N^2)
O(N2),最好的情况下是直接找到了id最大的节点发起了election,不需要
O
(
N
2
)
O(N^2)
O(N2) 的election和reply。
维基百科定义
维基百科上进行如下定义->Bully algorithm,整体选举流程讲得更清楚了,其中Answer(Alive)消息对应上面港中文课件的Reply消息,Coordinator(Victory)对应Leader消息:
霸道选举算法的假设:
- 通信通道是可靠的,更进一步的假设是系统中任何两个进程之间都可以通信
- 进程之间相互知道各自的进程编号,也就是说算法依赖一个全局的数据
- 假设进程能够明确地判断出一个正常运行的进程和一个已经崩溃的进程
霸道选举算法的选举流程
选举过程中会发送以下三种消息类型:
- Election消息:表示发起一次选举
- Answer(Alive)消息:对发起选举消息的应答
- Coordinator(Victory)消息:选举胜利者向参与者发送选举成功消息
触发选举流程的事件包括:
- 当进程P从错误中恢复
- 检测到Leader失败
选举流程:
- 如果P是最大的ID,直接向所有人发送Victory消息,成为新的Leader;否则向所有比它大的ID的进程发送Election消息
- 如果P在发送Election消息后没有收到Alive消息,则P向所有人发送Victory消息,成为新的Leader
- 如果P收到了从比自己ID还要大的进程发来的Alive消息,P停止发送任何消息,等待Victory消息(如果过了一段时间没有等到Victory消息,重新开始选举流程)
- 如果P收到了比自己ID小的进程发来的Election消息,回复一个Alive消息,然后重新开始选举流程
- 如果P收到Victory消息,把发送者当做Leader