raft算法:工程上使用较为广泛的强一致性,去中心化,高可用的分布式协议。
raft先选举出leader,leader负责接收所有客户端更新请求和数据同步,leader故障会重新进行选举
leader选举
日志复制
动画演示,很形象:Raft
leader election:
follow在约定时间内没有收到来自leader的心跳(挂了或者没有leader)就主动发起选举。假设100ms超时,有123,3个follower,这时候就看谁快达到超时,谁就先成为候选人。
自己节点先建个队伍,切换到候选人状态--》投自己一票--》给其他节点发送选举请求–》等待回复
1:收到超过半数以上的票(包括自己)则成为leader--》给所有节点发送消息,告知自己是leader
2:被告知已经有人当选leader,切换回follower
3:时间内没有达成条件,保持候选人状态,重新选举(避免平票情况,所以尽量选择奇数机器)
投票规则:
一个任期内,单一节点只能投一票
候选人知道的信息不能比自己少(降低同步数据的成本)
先到先得的原则,满足条件,谁快谁能先被投票
log Replication:
leader负责处理客户端的一切请求,并保证leader和follow按照同样的顺序执行请求,以保证数据一致。
共识算法:相同的初始状态+相同的输入 = 相同的结果
怎么保证同样的顺序那,使用本地时间会有很大的风险,所以使用replicate log来实现。
日志提交类似2PC,只不过只要保证半数以上的回复即可。