负载均衡为何如此重要？

原创于 2025-11-25 20:58:13 发布 · 204 阅读

CC 4.0 BY-SA版权

文章标签：

2 篇文章

订阅专栏

负载均衡是一种计算机网络技术，其核心目标是将网络请求或数据流量分发到多个服务器（或称为计算单元）上，以确保没有任何单个服务器过载。本质上，它是一个“流量指挥官”。

简单比喻：
想象一个银行有多个柜台。如果没有引导，所有客户都会涌向最近的柜台，导致一个柜台排长队，而其他柜台空闲。负载均衡器就像是银行的大堂经理，它根据每个柜台的忙碌情况，将新来的客户引导到最空闲的柜台，从而提升整体办理效率和服务体验。

提高性能与吞吐量
- 通过将请求分发到多个服务器，并行处理更多用户请求，缩短了用户等待时间，提高了应用程序的响应速度。
实现高可用性
- 负载均衡器会持续对后端服务器进行健康检查。如果某台服务器发生故障，负载均衡器会立即停止将流量转发给它，从而确保用户的请求只会被发送到健康的服务器上。这避免了单点故障，保证了服务的连续性。
增强可扩展性
- 当业务增长、流量增加时，可以通过简单地增加后端服务器数量来水平扩展系统能力。负载均衡器会自动将流量分配到这些新服务器上，整个过程对用户透明。
提供灵活性
- 可以进行系统维护和升级，而无需停机。可以先将一台服务器从服务池中摘除（下线），进行维护，维护完成后再重新加入。整个过程不会影响线上服务。

负载均衡器根据不同的算法来决定将下一个请求发送给哪台服务器。

轮询
- 按顺序将请求依次分配给每台服务器。是所有服务器性能相近时的最简单、公平的方法。
加权轮询
- 在轮询的基础上，为性能更强的服务器分配更高的“权重”，使其处理更多的请求。
最少连接
- 将新请求分配给当前连接数最少的服务器。非常适合处理长连接（如WebSocket）或会话时间差异很大的场景。
加权最少连接
- 在最少连接的基础上，考虑了服务器的权重。
源IP哈希
- 根据客户端的源IP地址计算出一个哈希值，将同一IP的请求总是定向到同一台服务器。这可以保证会话的连续性，适用于需要保持会话状态（Session）的应用。
随机
- 随机选择一个服务器。在服务器池足够大时，效果近似于轮询。