大话分布式系统

最新推荐文章于 2024-04-03 16:03:24 发布

草帽boy7

最新推荐文章于 2024-04-03 16:03:24 发布

阅读量492

点赞数

分类专栏：分布式系统

本文链接：https://blog.csdn.net/weixin_41315492/article/details/103936434

版权

分布式系统专栏收录该内容

3 篇文章 0 订阅

订阅专栏

分布式系统的发展？

自20世纪60年代大型主机被发明出来后计算机一致在保持着快速地更新迭代，“摩尔定律”一直在发挥着作用，到20世纪80年代，计算机向微型化发展趋势日渐明显，传统的集中式处理模式越来越不能适应人们的需求。集中式主机在发展中存在的问题比如一台大型机故障了那么整个系统就没了就404了，但同时计算机的小型机PC用户的不断增加访问量的加剧，对于系统的可用性和效率的要求也越来越严苛，基于这样的环境越来越多的企业开始弃用单个大型机而转向搭建多台小型机的分布式系统。随着21世纪移动互联网浪潮小型Arm设备如手机的增长伴随着前所未有的电子设备数量的增长对传统小型机进行硬件扩展加内存加是Cpu 已经不能满足如此庞大体量的需求这个IT系统带来了巨大的挑战如阿里就在 2009年开始成立了 “阿里云” 计划将其电商系统全部打造成由"云" 处理至 2019年阿里云成立10周年的双11 期间订单创建峰值更是高达54.4万笔/秒，所有交易皆是由 “云计算” 处理是2009年第一次双11的1360倍，至此迎来了 “分布式系统” 的黄金时代。

集中式系统和分布式系统的特点

集中式系统有一台或几台中心节点存储数据，然后调度其他节点进行处理消息的录入，输出处理。由于是由中心的所以不需要考虑节点间的协作关系。传统的网站一般数据库放在一台服务器上然后其他的服务器中心调度查询这台服务器他们之间协作是较简单的。
分布式系统:
- 分布性：就是说服务器可以在任何空间分布,可以放在火星，可以放在太阳上罒ω罒。
- 对等性：没有主从之分谁都有可能变成老大，所以数据是冗余存放的。一个时间段内只能有一定数量的主节点但是这些节点主机也有可能挂掉，等它们挂掉其他小弟就有机会上位，走向人生巅峰，就像克隆人一样如果被克隆的人给干掉了你就可以代替他。
- 并发性：假设某些节点的数据存在共享操作，协调多个节点进行高效的处理。假设小王买 2个商品在2个节点力其他人和小王买的是同样的操作此时要同时读写第一个商品的数据库如果同时有大量的人都是这个操作那么就会并发阻塞那此时比较好的方法是一部分人分配到别的数据库去找到对应的商品。别全部堵在一起买一件商品。
- 缺乏全局时钟：假设一场跑步比赛，有2个裁判，但是这两个裁判的表的时间相差1秒，那么你很难定义是谁先到终点。你处理的请求由于时间不一致，你没法判断 2个人在抢一件东西的时候谁先抢到的因为请求发送到了不同的机器上这两台机器时间是不严格一致的。
- 故障总是会发生的：假设一台机子发生故障的概率是 0.1% 那么一千台机子至少一台机子发生故障的概率是 $1-(1 - 0.001)^{1000}$ = 63.23% 所以要假设分布式系统总是会发生故障的。

分布式系统常见故障

1.通信故障
由于分布式系统通过网络进行通信，那么必然的网络故障就会导致节点出错，消息丢失，延迟都会造成很大的影响。

三态
由于网络是不可靠的，每一次网络请求都可能存在三种状态:
1. 成功
2. 失败
3. 超时

节点故障
节点发生宕机，或者由一些不可抗力所导致如：地震洪水挖断电缆等等。。。

什么是分布式系统呢?

网上一大堆啰里啰嗦的描述，但是我想说的是这些定义只有当你熟悉之后才能对有一个抽象的概念它是对一系列概念全面的概括对于新手来说一上来就给你这种说什么 2PC 3PC CAP理论最终一致性强一直弱一致还有烦死人的 paxos 协议和一大堆衍生的zooekeeper 的Zab协议 etc 的 Raft协议一上来是就想完全搞懂是很困难的，先挑一个简单的概念深入在慢慢深入才有利于理解。
对于理解一件事物比喻是绝佳的方法大脑对熟悉的事物能相对快速的建立神经突触回路
那什么是分布式系统呢说白了原来一个人的活干不完了加人呗但是加人的问题是什么呢那就是学习成本和协作成本你不能招了个人然后就不管了让他自生自灭吧至少最起码合作的2个人之间要交流互相分配任务处理任务如果是要负责一个客户那么还要统一交换意见
要不然意见所导致利益不一致怎么办，产生冲突顾客该相信谁呢。在现实世界中如此在计算机之间的协作亦是如此假设有N多篇人在买东西 A计算机觉得这个业务咱处理不过来了就把请求发给B，B就要协助处理这个任务但是他们之间不能 A和这个客户接触了一段时间对这个客户基本需求都有所了解能给他很贴心的服务不能给到 B去处理 B就完全不认识了请问您是谁您需要什么我可以哪里帮到你那么这个顾客下次再发请求 B 如果又交给C 那么 C有变成了一个完全不认识这个顾客的小白如果此时C再说我没空交给D 但C压根不知道D可能压根今天没上线来工作那么顾客就得到了 “神奇的404” 那么如果我是这个客户鬼才和你做生意，每次请求状态都变成最初始的状态就是无状态的。ps: Http就是无状态的协议，你请求几次http也不会记住上一次的你，是的比鱼的记忆还短。

那么从上面讲的内容可以发现在分布式系统中，最重要的是相互间的信息传递和同步，这就是分布式系统需要解决的内容。这个问题可以看做是著名的“拜占庭将军”问题了什么是"拜占庭将军"问题呢非常非常简单的说白了就是 3 ( 2n + 1)个人至少要 n +1 也就是 2个人不撒谎才保证整个节点之间是可信的。

有A、B、C三位将军，当A发出进攻命令时，B如果是叛徒，他可能告诉C，他收到的是“撤退”的命令。这时C收到一个“进攻”，一个“撤退“，于是C被信息迷惑，而无所适从。
如果A是叛徒。他告诉B“进攻”，告诉C“撤退”。当C告诉B，他收到“撤退”命令时，B由于收到了“进攻”的命令，而无法与C保持一致。

具体的请百度~。拜占庭问题是1982 年由 Leslie Lamport 提出
之后在 1990年 Leslie Lamport 被提出了 “The Part-Time Parliament” 于1998年发布了最终版本。
这个算法大致意思是如果每个人有一条记录那么拼起来就会是整个完整的记录。
其实比特币私链也是基于这个协议的。

什么是ACID?

首先解释下什么是事务？事务就是一系列操作的集合，你要打LOL 的话你就要打开电脑
点击鼠标打开lol客户端输入账号和密码匹配进入房间巴拉巴拉一系列操作。这些操作是有序的要不然你颠倒了看看还能不能打游戏并且要么就一起执行要么就不要打游戏。

A：原子性(Atomicity)，一个事务(transaction)中的所有操作，要么全部完成，要么全部不完成，不会结束在中间某个环节。
事务在执行过程中发生错误，会被回滚（Rollback）到事务开始前的状态，就像这个事务从来没有执行过一样。
就像你买东西要么交钱收货一起都执行，要么发不出货，就退钱。
A向B转账包含 A扣钱 B加钱这两个操作如果不是放在一起操作要是其中一次操作失败了
要么就是A被平白无故的扣钱了 B 没加钱，
要么就是A 没扣钱 B加钱了
当然银行或商家来说第一种情况可以忍第二种情况就坚决不能忍了。所以这两个操作要想原子一样一家人要整整齐齐的不能被分割要永远在一起。

C：一致性(Consistency)，事务的一致性指的是在一个事务执行之前和执行之后数据库都必须处于一致性状态。
如果事务成功地完成，那么系统中所有变化将正确地应用，系统处于有效状态。
如果在事务中出现错误，那么系统中的所有变化将自动地回滚，系统返回到原始状态。

打个比方假设你要吃饭但是你只能有2种状态吃完和没吃完但你中途突然有事不想吃了那么你就破坏了一致性。数据库在执行中只有提交完成和未提交但是如果中间出现一种提交到一半的中间状态那么久违反一致性原则了。

I：隔离性(Isolation)，指的是在并发环境中，当不同的事务同时操纵相同的数据时，每个事务都有各自的完整数据空间。
由并发事务所做的修改必须与任何其他并发事务所做的修改隔离。事务查看数据更新时，数据所处的状态要么是另一事务修改它之前的状态，要么是另一事务修改它之后的状态，事务不会查看到中间状态的数据。
打个比方，你买东西本来还在犹豫，但突然有一群人想要买那个东西，你被影响了就立马剁手买了其实那些是托提交了事务实际不会购买。隔离性要保证你的操作不被影响，，应该单独给你个包间让你单独思考买不买。

D：持久性(Durability)，指的是只要事务成功结束，它对数据库所做的更新就必须***保存下来。
即使发生系统崩溃，重新启动数据库系统后，数据库还能恢复到事务成功结束时的状态。
打个比方，你买东西的时候需要记录在账本上，即使老板忘记了那也有据可查。

分布式系统中的事务?

在分布式数据库中，数据分散在不同的机器上可能会发生各种故障机器宕机网络异常等。在分布式系统中这是无法避免要解决的问题。分布式事务需要对处于不同节点的事务进行操作假设一个场景一个电商网站下单服务在数据库A 付款服务在数据库B 仓库扣减服务在数据库C 这些原来可以放在一台机子上进行 3个事务操作要么成功要么失败。但是现在都分布式数据库了那就没办法一定满足ACID准则了

数据库 A 提交下单事务成功提交

数据库 B 负责提交付款事务没有成功提交

数据库C 负责仓库发货事务提交成功

由于B没有提交成功那么订单状态可能还卡在未付款但是仓库会去发货那么就违背了原子性一致性。ACID 准则就没法保证了，那么就需要回滚操作，但是这样顾客就白白下单了吗，浪费了顾客的感情，顾客可能就不会再下单了。这样就达不到可用性要求了但是没办法如果一定要保证系统的一致性原则那和可用性这两者必定是冲突的，绝大多数情况下顾客是上帝(金钱) 所以会牺牲一定的一致性原则。

CAP 理论和 BASE 理论

那么很明显能看出 ACID模型在分布式数据库明显存在不足，严格一致性会导致可用性的问题。
怎么构建一个兼顾可用性和一致性的分布式系统就成为无数工程师探讨的问题，就出现了CAP和BASE这样的分布式系统经典理论。

CAP定理

2000年7月，加州伯克利分校的Eric Brewer教授在ACM PODC会议上，首次提出了CAP猜想。2年后，来自麻省理工学院的Seth Gilbert和Nancy Lynch 从理论上证明了Brewer教授CAP猜想的可行性，从此CAP理论正式在学术上成为分布式计算领域工人定理，并深深影响了分布式计算的发展

那么分布式理论说明了什么呢？

一个分布式系统不可能同时满足一致性、可用性、和分区容错性这三个基本需求，只能满足其中两个。简单来说就是证明了，鱼和熊掌不可兼得就这个朴素的道理吧。

CAP中的一致性

分布式环境中，假设有一份数据在分布式系统中会存在多个副本那么对一个副本操作了那么其他副本也要保持最新副本的状态，如果能读到以前的就副本(脏读) 就是数据不一致的情况了。对某一个副本进行操作后立马就能在所有节点读到最新的值那么就称为强一致性，这很好理解对吧有些App要跟新因为有漏洞需要强制更新那么就是强一致更新，如果有些App只是日常普通跟新可以保留原来的App继续使用但最终所有人一定会都会慢慢更新的就称为弱一致更新。

可用性

可用性就表示全家 24小时营业，你去买东西总能在有限时间内被(在指定响应时间内)处理。不同的系统对有限时间内处理的定义不同。你用支付宝充话费那么可能需要几分钟甚至几个小时内都认为是有限时间内但你订外卖可能超过平30分钟就超时了。超时当然你会大发脾气取消订单差评，这对商家是不可以忍受的毕竟顾客是上帝(💰)。
强一致性：

分区容错性

所谓物以类聚人以群分，分布式系统可能也会被部署在某一个几种的物理空间中如果按地点分区华东华北华西华南这样可能某一个区域由于挖施工电缆把光纤挖没了(某电商大公司) 那么这块区域就被孤立了。此时要保证系统还能正常运行。

在这里插入图片描述

CAP 无法同时满足,但是对于分区容错性一定是需要满足的,在一个分布式系统中一定会存在这宕机这是常态，如果这个无法满足的话那么整个系统就是不稳定的不可靠的，那就没有存在的必要了。所以需要把经历根据任务特点花在C(一致性)和A(可用性)之间寻求平衡。

BASE理论

eBay 的架构师 Dan Pritchett 源于对大规模分布式系统的实践总结，在 ACM 上发表文章提出 BASE 理论，BASE 理论是对 CAP 理论的延伸，核心思想是即使无法做到强一致性（Strong Consistency，CAP 的一致性就是强一致性），但应用可以采用适合的方式达到最终一致性（Eventual Consitency）。

基本可用(Basically Available)：基本可用是指分布式系统在出现故障的时候，允许损失部分可用性，即保证核心可用。电商大促时，为了应对访问量激增，部分用户可能会被引导到降级页面，服务层也可能只提供降级服务。这就是损失部分可用性的体现。

软状态(Soft State)：软状态是指允许系统存在中间状态，而该中间状态不会影响系统整体可用性。分布式存储中一般一份数据至少会有三个副本，允许不同节点间副本同步的延时就是软状态的体现。MySQL Replication 的异步复制也是一种体现。

最终一致性(Eventual Consistency)：最终一致性是指系统中的所有数据副本经过一定时间后，最终能够达到一致的状态。弱一致性和强一致性相反，最终一致性是弱一致性的一种特殊情况。

ACID 和 BASE 的区别与联系：

ACID 是传统数据库常用的设计理念，追求强一致性模型。BASE 支持的是大型分布式系统，提出通过牺牲强一致性获得高可用性。

ACID 和 BASE 代表了两种截然相反的设计哲学，在分布式系统设计的场景中，系统组件对一致性要求是不同的，因此 ACID 和 BASE 又会结合使用。

小结：

在分布式系统中很难做到ACID那么此时 BASE就会牺牲掉部分的一致性，数据可以暂时不一致但是最终节点之间通过特定如Paxos协议达成最终消息的一致。BASE理论面向的是大型高可用可扩展的分布式系统，通过牺牲一定时间内的一致性，最终还是会达到最终一致，在实际分布式场景中，不同业务单元和组件对数据一致性要求是不同的，因此在具体的分布式系统架构设计中需要平衡业务和需求，灵活结合使用ACID 和BASE理论。

当然涉及到具体的解决方案
就会有2PC
3PC
Paxos算法等且听下回分解。
To be continue。。。

资料参考：

《从Paxos到ZooKeeper 分布式一致性原理实践》
第一次有人把“分布式事务”讲的这么简单明了 https://developer.51cto.com/art/201808/581174.htm

草帽boy7

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大话分布式系统

Notify：原标题:MIT6.824 Spring 2020 分布式系统课程 lab1之mapreduce(二) 这是写着写着就变成了另一篇文章分布式系统的发展？自20世纪60年代大型主机被发明出来后计算机一致在保持着快速地更新迭代，“摩尔定律”一直在发挥着作用，到20世纪80年代，计算机向微型化发展趋势日渐明显，传统的集中式处理模式越来越不能适应人们的需求。集中式主机在发展中存在的问题比...
复制链接

扫一扫