谈谈CAP定理和BASE理论

首先说说分布式面临的几个问题:

1)通信异常

网络本身的不可靠性,因此每次网络通信都会伴随着网络不可用的风险(光纤、路由、DNS等硬件设备或系统的不可用),都会导致最终分布式系统无法顺利进行一次网络通信,另外,即使分布式系统各节点之间的网络通信能够正常执行,其延时也会大于单机操作,存在巨大的延时差别,也会影响消息的收发过程,因此消息丢失和消息延迟变得非常普遍。

2)网络分区

网络之间出现了网络不连通,但各个子网络的内部网络是正常的,从而导致整个系统的网络环境被切分成了若干个孤立的区域,分布式系统就会出现局部小集群,在极端情况下,这些小集群会独立完成原本需要整个分布式系统才能完成的功能,包括数据的事务处理,这就对分布式一致性提出了非常大的挑战。

3)节点故障

节点故障是分布式系统下另一个比较常见的问题,指的是组成分布式系统的服务器节点出现的宕机或"僵死"现象,根据经验来说,每个节点都有可能出现故障,并且经常发生。

4)三态

分布式系统每一次请求与响应存在特有的"三态"概念,即成功、失败和超时。

分布式系统中,由于网络是不可靠的,虽然绝大部分情况下,网络通信能够接收到成功或失败的响应,但当网络出现异常的情况下,就会出现超时现象,通常有以下两种情况:

1.由于网络原因,该请求并没有被成功的发送到接收方,而是在发送过程就发生了丢失现象。

2.该请求成功的被接收方接受后,并进行了处理,但在响应反馈给发送方过程中,发生了消息丢失现象。

CAP定理

2000 年7月的时候,加州大学伯克利分校的Eric Brewer 教授提出了 CAP 猜想,2年后,被 来自于麻省理工的Seth Gilbert 和 Nancy Lynch 从理论上证明了猜想的可能性,从此,CAP 定理正式在学术上成为了分布式计算领域的公认定理。并深深的影响了分布式计算的发展。

CAP理论含义是,一个分布式系统不可能同时满足一致性(C:Consistency),可用性(A:Availabilty)和分区容错性(P:Partition tolerance)这三个基本需求,最多只能同时满足其中的两个。

选项描述
C 一致性分布式系统当中的一致性指的是所有节点的数据一致,或者说是所有副本的数据一致
A 可用性Reads and writes always succeed. 也就是说系统一直可用,而且服务一直保持正常
P 分区容错性系统在遇到一些节点或者网络分区故障的时候,仍然能够提供满足一致性和可用性的服务

我们可以举一个例子,来证明为什么CAP不能同时满足

假如有一个系统如下:

 

有用户向N1发送了请求更改了数据,将数据库的数据从V0更新成了V1。这个时候由于网络断开了,所有N2数据库里面的数据还是V0,如果这个时候有一个请求发给了N2,但是N2并没有办法给出最新的数据V1,这个时候怎么办呢?

这个时候无非有两种方法,一种就是将错就错,返回错误的数据V0。第二种是阻塞等待,等待网络通信恢复,N2更新最新的数据库V1,然后返回给用户。很显然,前者就是牺牲了数据的一致性,后者就是牺牲了可用性。

这个简答的例子就说明了,在分布式系统中,CAP三个特性是无法同时满足的,必然要舍弃一个。三者舍弃一个,也有三种排列组合。

1)舍弃A(可用性),保留CP(一致性和分区容错性)

一个系统保证了一致性和分区容错性,舍弃可用性。也就是说在极端情况下,允许系统出现无法访问的情况,这个时候,往往会牺牲用户体验,让用户保持等待,一直到系统数据一致了之后,才恢复服务。

2) 舍弃C(一致性),保留了AP(可用性和分区容错性)

这种是大部分的分布式系统的设计,保证了高可用和分区容错性,但是会牺牲一致性。

3)舍弃P(分区容错性),保留了CA(一致性和可用性)

分区容错性是分布式系统的一个前提,没有P,也就没有分布式系统,这种情况是不存在的。

BASE 理论

什么是base理论?

BASE:全称:Basically Available(基本可用),Soft state(软状态),和Eventually consistent(最终一致性)这是三个短语的缩写。

BASE是对CAP中一致性和可用性权衡的结果,BASE理论的核心思想是:即使无法做到强一致性,但每个应用都可以根据自身业务的特点,,采用适当的方法来试系统达到最后一致性的。

1)Basically Available(基本可用)

基本可用是指分布式系统在出现不可预知故障的时候,允许损失部分可用性——但请注意,这绝不等价于系统不可

用。以下就是两个"基本可用"的例子

响应时间上的损失:正常情况下,一个在线搜索引擎需要在0.5秒之内返回给用户相应的查询结果,但由于出

现故障(比如系统部分机房发生断电或断网故障),查询结果的响应时间增加到了1~2秒。

功能上的损失:正常情况下,我们在淘宝购物,平时就很顺利的西单购物,但是到了淘宝双十二,京东618时候,由于购物人数剧增,为了保护系统的稳定性(或者保证一致性),部分消费者可能会被引导到一个降级页面,比如活动火爆请稍后再试。

2)Soft state(软状态)

什么是软状态呢?相对于一致性,要求多个节点的数据副本都是一致的,这是一种"硬状态"。

软状态是指:允许系统中的数据存在一个中间状态,并认为该状态不影响系统的整体可用性,意思就是允许系统多个节点数据副本同步存在一个延迟。

3)Eventually consistent(最终一致性)

最终一致性强调是的系统中所有的数据副本,在经过一段时间的同步后,最终能达到一个一致的状态。因此最终一致性的本质是需要系统保证最终数据能达到一个一致,而不是说实时保持一致性。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值