Sentinel 集群限流的原理基于分布式环境下的全局流量控制,旨在在多节点集群中对某个资源进行统一、精确的流量控制。以下是 Sentinel 实现集群限流的主要原理:
-
Token Server(令牌服务器):
- 在集群模式下,Sentinel 引入了一个或多个 Token Server(也称为 Cluster Node),它们负责生成和管理全局唯一的令牌(Token)。
- 每个服务节点在需要执行一个受控操作时,会向 Token Server 请求一个令牌。
-
Global Slot:
- Sentinel 在集群限流场景下引入了 Global Slot,用于处理与集群相关的逻辑,如请求令牌、响应令牌结果等。
-
令牌分配算法:
- Token Server 根据预设的限流规则,按照特定的时间窗口统计每个资源的调用次数,并根据阈值决定是否发放令牌。
- 通常使用滑动窗口算法来计算令牌的发放速率,确保整个集群在指定时间窗口内的请求数量不超过设定的限流阈值。
-
请求拦截与放行:
- 当客户端(服务节点)发起请求时,首先会通过 Local Slot 来判断是否为集群限流资源,并触发向 Token Server 请求令牌的过程。
- 如果 Token Server 返回可用令牌,则允许请求继续;否则,将根据配置的降级策略执行相应的动作,例如快速失败或者等待队列等。
-
心跳同步与状态一致性:
- 为了保证所有服务节点的限流规则一致且实时生效,服务节点需定期向 Token Server 发送心跳包以获取最新的限流规则,并保持本地规则集与中心规则库同步。
- 对于 Token Server 的高可用性,可以采用主从复制或多实例部署方式,确保即使部分节点不可用,集群限流功能也能正常工作。
-
集成与扩展:
- Sentinel 提供了多种方式将 Token Server 集成到微服务体系中,如独立部署、嵌入式部署等,并支持自定义实现 Token Server 接口以适应不同业务场景的需求。
总结来说,Sentinel 集群限流的核心在于构建了一个中心化的令牌颁发系统,结合各服务节点间的协作以及有效的分布式协调机制,实现在分布式环境下的全局流量控制目标。