1、Zookeeper理论基础之CAP定理
1.5 CAP定理
1.5.1 简介
CAP原则又称为CAP理论,指的是在一个分布式系统中,Consistency(一致性)、Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。
一致性(C):分布式系统中多个主机之间是否能够保持数据一致性的特性。即当系统数据发生更新操作之后,各个主机中的数据是否仍然处于一致的状态。
可用性(A):系统提供的服务必须一直处于可用的状态,即对于的每一个请求,系统总是可以在有限的时间内对用户做出响应。
分区容错性(P):分布式系统在遇到任何网络分区故障时候,仍然保证对外提供满足一致性和可用性的服务。
对于分布式系统来讲,网络环境相对不可控,出现网络分区是不可避免的,因此必须具备分区容错性。但其并不能保证同时一致性与可用性。CAP原则对于一个分布式系统来说,只能满足其中两项,即要么CP,要么AP。
1.5.2 BASE理论
BASE是Basically Available(基本可用)、Soft State(软状态)、Eventually Consistent(最终一致性)三个短语的简写。BASE是对CP和AP权衡的结果。
BASE理论的核心思想:即使无法做到强一致性,但每个系统可以根据自身的业务特点,采取适当的方式来使系统达到最终一致性。
(1)基本可用
基本可用是指在分布式系统出现不可预知的故障时,允许损失部分可用性。
比如:响应时间上的损失;功能上的损失。
(2)软状态
软状态是指允许系统数据存在中间状态,并认为该中间状态的存在不会影响系统整体可用性,即允许系统主机间进行数据同步的过程存在一定的延迟。软状态,其实就是一种灰度状态,过渡状态。
(3)最终一致性
最终一致性是指系统中所有的数据副本,在经过一段时间同步后,最终能达到一个一致的状态。因此,最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性。
1.5.3 ZK与CP
zk遵循的是CP原则,即保证一致性和网络分区容错性,但不保证可用性。体现在哪里呢?
当Leader宕机后,zk集群会发起新一轮投票选举,投票选举期间所有的Follower主机都处于LOOKING状态,对外不提供服务。但Leader的选举一般在200ms内完成,最长不超过60s,整个选举期间,zk集群是不对外提供服务的,不接受客户端的读写请求的,即zk集群处于瘫痪状态。所以它不满足可用性。
Eureka AP原则
1.5.4 zk可能存在脑裂问题
zk脑裂问题指的是:在多机房部署中,若出现网络连接问题,形成多个分区,则可能出现脑裂问题,如果出现脑裂问题,可能会导致数据不一致。
zk脑裂详解:
- 当A机房、B机房、C机房之间的网络都正常连接的时候,3个机房的zk主机形成了一个zk集群,A机房有一台zk主机被选举为Leader,B、C机房的zk主机全部是Follower;
- 当A机房与B机房,A机房与C机房网络突然中断,导致B、C机房的Follower不能与A机房的Leader通信,此时B、C机房的Follower就会认为Leader已经挂了,B、C机房机会进入重新Leader选举,最终会在B or C机房中选举一台zk主机为Leader;
- 当B、C机房中的某台zk主机被选举为Leader时,此时A、B、C三个机房同时存在了2个Leader,这就是zk脑裂问题,如果A、B、C三个机房的zk同时提供对外服务,可能就会导致数据不一致问题。