高可用和cloud pattern总结

最新推荐文章于 2024-07-19 16:36:18 发布

weixin_33704234

最新推荐文章于 2024-07-19 16:36:18 发布

阅读量187

点赞数

文章标签： python 操作系统

原文链接：https://my.oschina.net/tigerlene/blog/3005693

版权

2019独角兽企业重金招聘Python工程师标准>>>

高可用

分布式系统的技术栈
 关于高可用系统

关于系统高可用，最好就是直接看刚刚放的链接，以我现在的水平总结不会超过上面的文章，不过我想通过自己的方式表达出来。

分布式系统的特点

网络不可靠（拥挤，延迟，光缆被挖断，运营商网络故障等）；
faults and patial failure

In a distributed system, there may well be some parts of the system that are broken in some unpredictable way, even though other parts of the system are working fine. This is known as a partial failure.

If we want to make distributed systems work, we must accept the possibility of partial failure and build fault-tolerance mechanisms into the software.

时钟同步问题
拜占庭问题
顺序问题

也正是因为这些问题，所以我们的系统要fault-tolerance.

冗余

因为各种客观原因（操作系统，电源，磁盘，误操作等..），单机会宕机，导致系统不可用。
对于无状态服务，我们需要多台机器 + 负载均衡来处理，所以负载均衡就是重要的组件，要保证负载均衡的高可用，同时也要冗余（常用的方式主从）。而当一组负载均衡达到上限后，就需要分区，使用多组负载均衡。负载均衡的分类
 负载均衡算法

对于有状态的服务，应用层通过2pc（两阶段提交），TCC等方式保证数据正确提交，而数据存储节点，通过复制（同步或异步）的方式冗余存储，但不同的方式有各自的优缺点。

M/S、MM实现起来不难，但是会有很多问题，2PC的问题就是性能不行，而Paxos的问题就是太复杂，实现难度太大。