● 一致性(C):在分布式系统中的所有数据备份,在同一时刻是否同样的值。(等同于所有节点访问同一份最新的数据副本)
另外扩展性也是分布式系统中很重要的一点: 1.拆 (一致性 hash,虚拟节点,不一定要自动均衡 ,hash 算法) 2.要求自动扩容和缩容. 数据迁移 要求的特性 2.1 可遍历 (本身有序和无序)
c,a好理解,都有数字指标可以说明。
c: 三台机器,1台数据已同步,一致率=1/3 . 一致性又分为 最终一致性,强一致性,弱一致性
a: 三次请求,1次成功,两次拒绝服务。 可用率=1/3
p(分区容忍性): 容忍多少分区。 现实世界中,机器通过网络连接。一台机器就可算一台分区。 可以用机器数表示,机器数越高代表分区数越多,该系统的分区容忍性越高。分布式,多个机器,网络不好,分区本来就多. 又不能忍受分区,故分区容忍性肯定就差的.
例子:
单机:
p很差,故c,a都可以比较高
2台机器: p一般,当要求强一致性时(c高),a可能就会比较低。
机器非常多: p非常好,当要求强一致性时,a就非常低了。 所以基本上都只是要求最终一致性。
所以zookeeper一般都是三台机器连接,p不是很高,但是又有多台机器,有备份,能保证数据的安全性。
zookeeper 强调PC的,a差.
etcd 强调PA的,数据一致性要求差. 服务发现
开源的服务发现项目Zookeeper,Doozer,Etcd
之前也有一篇文章是说为什么不推荐用zookeeper作为服务发现工具
文献:http://baike.baidu.com/link?url=bxYwuC6ZsKmcs_LUwfN15Ko_Qv0211DeWujZRLN5UrVpaoAU6fIOVFNc4jIG99IV9HHhWf4F-y3rPR74lQ48j_