分布式系统设计指南

最新推荐文章于 2024-09-20 14:37:00 发布

超越不平凡

最新推荐文章于 2024-09-20 14:37:00 发布

阅读量995

点赞数 31

分类专栏：微服务文章标签：分布式 CAP BASE 架构

本文链接：https://blog.csdn.net/qq_39209927/article/details/139598717

版权

微服务专栏收录该内容

13 篇文章 2 订阅

订阅专栏

一、分布式简介

分布式系统是由单体应用发展而来的，单体应用是将所有的业务功能维护在一个巨无霸的服务中，业务初期可能还能接受，但随着业务发展，单体应用中要维护的代码越来越多，这就导致了代码膨胀、维护成本高、不能快速迭代回滚、沟通成本高、业务耦合互相影响、部署繁琐等问题的出现。为了解决这些问题开始寻求将单体应用进行拆分，按业务模块将单体应用拆分成更小、更容易管理的若干个小服务。

从单体应用发展为分布式系统是对技术、组织结构、开发流程等多方面的全面改革。那什么是分布式系统呢？

分布式系统是一种由多台计算机(节点)通过网络互相连接，协同工作以完成共同任务的计算模型。这些节点共享资源并协作处理任务，从用户角度来看，整个系统表现得仍然像一个单体应用。

二、分布式系统核心概念

分布式系统设计中，有两个核心概念，分别为 CAP 理论和 BASE 原理，他们指导着分布式系统如何在复杂环境下做出权衡和设计决策。

2.1 CAP 理论

CAP 理论指出在分布式系统设计中，有三个基本要求，但在任何系统中最多只能满足其中的两个，这三个基本要求为：

一致性(Consistency)：所有节点在同一时间看到的数据是一致的，即数据更新后，所有访问都会返回最新的值。
可用性(Availability)：每个请求都能在有限时间内得到响应，无论成功还是失败。
分区容错性(Partition tolerance)：即使系统中部分网络不可用，系统仍然能够继续运行。

在实际应用中，由于网络分区是不可避免的，所以通常需要再一致性和可用性之间做出选择。那什么是网络分区呢？在分布式系统中，多个节点之间的网络原本是连通的，但因为某些故障某些节点直接不能连通了，整个网络就被分割成几个区域，这就叫做网络分区。

在实际应用中，一些中心化组件都会在 CAP 中进行取舍，如 ZooKeeper 为了保证数据的一致性结果，保证了 CP。在 Nacos 中服务注册发现保证了 AP，配置中心保证了 CP。

2.2 BASE 原理

BASE 原理是对 CAP 理论中一致性和可用性权衡的一种应用哲学，在无法保证强一致性的情况下，应该如何设计系统，BASE 原理由三部分组成：

基本可用(Basically Available)：系统出现故障时，允许部分功能不可用，但核心功能仍然能正常工作。
软状态(Soft State)：系统可以有一段时间内的中间状态，这个状态可能与最终状态不一致，但在一段时间后会达到一致。
最终一致性(Eventual Consistency)：系统保证在没有新更新操作的前提下，所有节点的数据最终会达到一致状态，但不保证实时一致性。

BASE 原理强调牺牲实时一致性来换取系统的高可用性和可扩展性，适用于那些对实时一致性要求不高，但对可用性和伸缩性有较高要求的场景。

BASE 原理在实际应用中的案例：

电商系统中在高并发促销期间，为了保证服务可用性，订单系统会先接受订单请求，稍后在进行库存扣减和检查，这样就可能出现短时数据不一致，但最终数据时一致的。
在消息中间件中，如Kafka或RabbitMQ，消息生产者发送消息到队列后，可能立即确认消息发送成功，但实际上消息还未被消费者消费处理。这里消息的发送与消费之间存在时间差，体现了软状态，但系统最终会确保消息被正确处理，达到消息的最终一致性。

三、分布式系统设计

分布式系统设计的最终目标是要实现系统的高可用性、高扩展性、可伸缩性、容错性等，那要如何实现这些目标呢，下面来总结下分布式系统设计的实战经验。

3.1 微服务拆分

分布式设计的前提是进行服务拆分，可以根据主链路规划对服务进行拆分，每个服务负责一个明确的边界清晰的业务功能。

服务拆分后每个服务可以使用异构语言进行开发，可以实现快速迭代和部署，服务拆分后可以有自己的数据库访问，降低服务间的耦合度，由于每个服务只维护单一业务功能，所以系统的复杂度也大大降低，便于维护。

3.2 通信模型

服务拆分后最重要的是服务之间如何进行通信，服务间的交互才能实现业务的完整性。服务间通信交换数据，需要选择合适的通信协议(HTTP、gRPC)和数据交换格式(JSON)等。

采用高效的通信协议可以使服务间实现高性能安全的网络通信，是分布式系统中非常重要的一环。另外可以选择同步通信与异步通信，对应请求-响应、发布订阅或基于事件模型运行。

3.3 负载均衡

负载均衡是一个关键组件，目的是为了优化资源使用、提高系统响应速度、保证系统的稳定性和可靠性。负载均衡策略确保请求或任务在多个节点之间公平且高效的分配。

如果没有负载均衡，那大部分请求可能会集中在少数的节点上，而大部分节点处于闲置状态，这显然是不合理的，还可能会出现单点故障。通过负载均衡，即使某一部分节点出现故障，其他部分仍然能继续正常对外提供服务，能有效缩小故障范围。

负载均衡技术有很多，软件方面的负载均衡技术有 Nginx、HAProxy、Envoy 等。在微服务中还可以通过注册中心实现负载均衡，如 Nacos、Consul等。

3.4 数据一致性

在分布式系统中，数据一致性是一个核心挑战，尤其在面对分布式环境中的数据复制、分布式事务处理等情况。上文提到的 CAP 理论值中，需要在一致性和可用性之间做权衡。数据一致性包括如下内容：

强一致性：这是最高级别的数据一致性模型，要求任何读操作都能读取到最新写入的数据。实现强一致性通常会牺牲一定的可用性或分区容错性，或者增加系统的复杂性和延迟。
最终一致性：这是一种较弱的一致性模型，允许系统中的数据副本在一段时间后达到一致状态，而不是立即一致。最终一致性牺牲了即时一致性，换取了更高的可用性和分区容错性。

分布式环境下数据一致性可以通过 Raft 协议等来保证，可以确保数据在副本间的一致性。