很好的动画http://thesecretlivesofdata.com/raft/
节点分为3种状态:leader、follower、candidate
leader选举
网络刚开始时,所有节点都是follwer状态,如果他们收不到leader发过来的消息,就会有其中1个节点变成candidate状态。
candidate节点给其他节点发送请求投票消息。
其他follwer节点会返回给candidate节点消息,表示同意。
如果收到一般以上节点同意,这个节点会成为leader状态。
整个网络的所有改变必须经过leader节点。
客户端会发一个消息给leader节点,leader节点会加一个entity到日志log中。
leader会把这个entity广播到其他follower节点。
当leader节点收到大多数节点回复同意的时候,leader会commit这个entity,然后广播给其他follower节点,follower节点收到commit消息,本地提交,落盘。
election timeout选举超时,这个值是随机的,在150ms到300ms之间。谁最快的election timeout的,谁就会成为candidate状态,然后给自己投一票,然后给其他节点发送要求投他为主节点的request。
heartbeat timeout,每隔一段时间间隔,leader就得给follower发送一次。follower回复append entity消息给leader。
如果一个节点在election timeout的间隔中,收不到hearbeat消息,那么它自己就会成为candidate,从新开始共识。
如果leader选举中产生2个candidate,不会产生leader,所有节点会再次election timeout从新选举。
网络脑裂处理
当发生脑裂,网络分叉时,占大多数的节点,可以继续处理交易。占少数的节点,就不能处理交易了,因为得不到大多数的同意。
从这里可以看出,raft只能用到联盟链或私链中。
当网络通了的时候,少数节点的网络,会回滚,重新得到多数节点的log,和比特币长链吃短链一个原理。