开头我们先简单回顾下分布式环境中老生常谈的一个东西 - CAP
C - consistency 强一致性
A - availability 可用性
P - partition tolerance 分区容错性
CAP核心理论
一个分布式系统不可能同时很好的满足一致性,可用性,和分区容错性三个需求
因此根据CAP原则讲nosql 数据库分成了满足CA原则,满足CP原则 和满足 AP原则三大类
CA - 单点集群,满足一致性,可用性,通常在可拓展性上不太强大
CP - 满足一致性,分区容错性的系统,通常性能不是特别的高
AP - 满足可用性,分区容错性,通过对数据一致性要求低一些。
所以,分布式系统考虑到集群的拓展,只能选择CP 或者 AP 。
Zookeeper 保证CP
当向注册中心查询服务列表时,我们可以容忍注册中心返回的是几分钟以前的注册信息,但不能接受服务直接down调不可用,也就是说,服务注册功能对可用性的要求高宇一致性。
但是zk会出现这样一种情况,当master节点因为网络故障与其他节点失去联系时,剩余节点回重新进行leader选举,问题在于选举leader的时间太长,30~120s且选举期间整个zk集群都是不可用的。这就导致在选举期间注册服务瘫痪,在云部署的环境下,因网络问题使得zk集群失去master节点很大概率会发生的事情。虽然服务能够最终恢复,但是漫长的选举时间导致的注