Raft
介绍
谈到一致性算法,最出名的莫过于大名鼎鼎的Lamport于1980s提出的Paxos,但是这篇论文实在是很难读懂,因此也有很多论文是来简单描述Paxos算法的。Raft的初衷就是以一种简单易于理解的算法实现Paxos想同的功能,但是伴随着的是某些方面性能的损失。Raft 和另一种一致性算法Viewstamped Replication很相似,Viewstamp是于1990s提出来的,而Raft是于2014年提出的。
几个基本概念
majority vote (“quorum” systems):需要奇数个server常用的是3,需要注意的是,这里的大多数是指所有的服务器的大多数,而不是指live的服务器。1这样可以防止split brain问题。容错性,所有服务器的数量为2f+1,在可以容忍f个服务器宕机。2还有一个好处,,majority vote可以确保在每一个term里的集群和上一个term的集群有交集,因此可以包含上个任期的log信息,当出错时用于恢复
log 意义:1 并发时可以确定一个顺序order,然后复制给每一个replicas,以达到同步的目的
2 持久性,写到磁盘
leader-follower 是通过同步log来达到一致的,因此若leader和follower的处理log的速度差别很大,会出现问题。Raft没有flow control,假设leader已非常快的速度产生log,然后复制给follower,然后follower消费log的速度因为某种原因很慢,这样follower的机器会不断的申请内存和磁盘知道爆掉。生产环境中可以通过额外的通信机制来解决这种问题。