cassandra集群一致性实现
cassandra集群使用Gossip的点对点通信协议,节点定期交换关于他们自己和他们所知道的其他节点的状态信息。Gossip 过程每秒运行一次,并与集群中最多三个其他节点交换状态消息。节点交换关于他们自己以及gossiped 的其他节点的信息,因此所有节点都可以快速了解集群中的所有其他节点。在Gossip交换期间,对于一个特殊的节点,比较旧的信息将被最新的信息覆盖。
为防止Gossip通信出现问题,为集群中的所有节点使用相同的种子节点列表。在节点第一次启动时最为关键。默认情况下,节点会记住在后续重新启动之间Gossip的其他节点。除了为加入集群的新节点引导Gossip过程之外,种子节点指定没有其他目的。种子节点不是单点故障,除了节点引导之外,它们在集群操作中也没有任何其他特殊用途。
注意:在多个数据中心群集中,种子列表中包含每个数据中心(复制组)中的至少一个节点。建议为每个数据中心指定多个种子节点以实现容错。否则,当引导节点时,Gossip必须与另一个数据中心通信。 建议不要将每个节点都设置为种子节点,因为增加了维护并降低了Gossip性能。建议使用小种子列表(每个数据中心大约有三个节点)。
Gossip Protocol的优势
1、可扩展性
可以允许节点的任意增加和减少,新增加的节点状态最终会与其他节点一致。
2、容错性
任何节点的宕机和重启都不会影响Gossip Protocol 散播信息,Gossip Protocol具有天然的分布式系统容错特性。
3、去中心化
Gossip Protocol不需要中心节点,所有节点都可以是对等的,任何一个节点无需知道整个网络状况,只需要网络连通状态,任意一个节点就可以把信息散播到所有节点。
4、一致性收敛
仅需要O(log(n))个回合,gossip协议即可将信息传递到所有的节点。
Gossip Protocol的缺陷
1、信息延迟
由于Gossip Protocol是随机选择几个节点散播信息,然后被选择的节点再次重复操作,信息通过多次散播最终到达全部节点,因此不可避免产生信息延迟。
2、信息冗余
Gossip Protocol,节点会定期随机选择邻近的节点发送信息,而收到消息的节点也会重复该操作,因此不可避免已存在的信息被重复发送同一节点上,造成信息的冗余。因Gossip Protocol定期发送,即使收到了信息的节点可能会反复收到重复的信息,加重了信息的冗余。