一、前言
除了hystrix可以做服务降级,有另外一个Sentinel框架也做的很好
二、Sentinel 高可用流量管理框架详解
Sentinel是一个面向分布式服务架构的高可用流量防护组件,主要以流量为切入点,从限流、流量整形、熔断降级、系统负载保护、热点防护等多个维度来帮助开发者保障微服务的稳定性。以下是关于Sentinel高可用流量管理框架的详细解析:
一、主要功能特性
- 流量控制:Sentinel可以根据资源的调用关系、运行指标(如QPS、线程池、系统负载等)和控制效果(如直接限流、冷启动、排队等)来进行灵活的流量控制。它允许开发者自由选择控制的角度,并进行灵活组合,从而达到想要的效果。
- 熔断降级:当调用链路中的某个资源出现不稳定时,Sentinel会迅速进行熔断降级,防止级联错误的发生。具体来说,当检测到调用链路中某个资源的异常比例升高或请求响应时间过长时,Sentinel会限制对该资源的调用,让请求快速失败,从而避免影响到其他资源。
- 系统自适应限流:Sentinel能从整体维度对应用入口流量进行控制,结合应用的Load、CPU使用率、总体平均RT、入口QPS和并发线程数等监控指标,通过自适应的流控策略,使系统的入口流量和负载达到平衡,确保系统在最大吞吐量的同时保持稳定性。
二、应用场景
Sentinel承接了阿里巴巴近10年的双十一大促流量的核心场景,例如秒杀、消息削峰填谷、集群流量控制、实时熔断下游不可用应用等。这些场景都充分展示了Sentinel在应对高并发、大流量场景下的优秀性能。
三、实时监控与开源生态
Sentinel提供了实时的监控功能,可以在控制台中查看接入应用的单台机器秒级数据,甚至500台以下规模的集群的汇总运行情况。此外,Sentinel还具有广泛的开源生态,提供了与Spring Cloud、Dubbo、gRPC等开源框架/库的整合模块,方便开发者快速接入。
综上所述,Sentinel高可用流量管理框架通过其灵活的流量控制、熔断降级和系统自适应限流等功能,为分布式服务架构提供了强大的流量防护能力。同时,其丰富的应用场景、实时监控和开源生态也使得Sentinel成为开发者在构建高可用微服务时的理想选择。
四、Sentinel设计理念(摘自小鼠标李豪)
Sentinel 功能和设计理念
流量控制
什么是流量控制
流量控制在网络传输中是一个常用的概念,它用于调整网络包的发送数据。然而,从系统稳定性角度考虑,在处理请求的速度上,也有非常多的讲究。任意时间到来的请求往往是随机不可控的,而系统的处理能力是有限的。我们需要根据系统的处理能力对流量进行控制。Sentinel 作为一个调配器,可以根据需要把随机的请求调整成合适的形状,如下图所示:
流量控制设计理念
流量控制有以下几个角度:
-
资源的调用关系,例如资源的调用链路,资源和资源之间的关系;
-
运行指标,例如 QPS、线程池、系统负载等;
-
控制的效果,例如直接限流、冷启动、排队等。
Sentinel 的设计理念是让您自由选择控制的角度,并进行灵活组合,从而达到想要的效果。
熔断降级
什么是熔断降级
除了流量控制以外,及时对调用链路中的不稳定因素进行熔断也是 Sentinel 的使命之一。由于调用关系的复杂性,如果调用链路中的某个资源出现了不稳定,可能会导致请求发生堆积,进而导致级联错误。
Sentinel 和 Hystrix 的原则是一致的:当检测到调用链路中某个资源出现不稳定的表现,例如请求响应时间长或异常比例升高的时候,则对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联故障。
熔断降级设计理念
在限制的手段上,Sentinel 和 Hystrix 采取了完全不一样的方法。
Hystrix 通过 线程池隔离 的方式,来对依赖(在 Sentinel 的概念中对应 资源)进行了隔离。这样做的好处是资源和资源之间做到了最彻底的隔离。缺点是除了增加了线程切换的成本(过多的线程池导致线程数目过多),还需要预先给各个资源做线程池大小的分配,并且对于一些使用了 ThreadLocal 的场景来说会有问题(如 Spring 事务)。
Sentinel 对这个问题采取了两种手段:
-
通过并发线程数进行限制
和资源池隔离的方法不同,Sentinel 通过限制资源并发线程的数量,来减少不稳定资源对其它资源的影响。这样不但没有线程切换的损耗,也不需要您预先分配线程池的大小。当某个资源出现不稳定的情况下,例如响应时间变长,对资源的直接影响就是会造成线程数的逐步堆积。当线程数在特定资源上堆积到一定的数量之后,对该资源的新请求就会被拒绝。堆积的线程完成任务后才开始继续接收请求。
-
针对慢调用和异常对资源进行降级
除了对并发线程数进行控制以外,Sentinel 还可以根据响应时间和异常等不稳定因素来快速对不稳定的调用进行熔断。当依赖的资源出现响应时间过长后,所有对该资源的访问都会被直接拒绝,直到过了指定的时间窗口之后才重新渐进式地恢复。
系统自适应保护
Sentinel 同时提供系统维度的自适应保护能力。防止雪崩,是系统防护中重要的一环。当系统负载较高的时候,如果还持续让请求进入,可能会导致系统崩溃,无法响应。在集群环境下,网络负载均衡会把本应这台机器承载的流量转发到其它的机器上去。如果这个时候其它的机器也处在一个边缘状态的时候,这个增加的流量就会导致这台机器也崩溃,最后导致整个集群不可用。
针对这个情况,Sentinel 提供了对应的保护机制,让系统的入口流量和系统的负载达到一个平衡,保证系统在能力范围之内处理最多的请求。
Sentinel 是如何工作的
Sentinel 的主要工作机制如下:
-
对主流框架提供适配或者显示的 API,来定义需要保护的资源,并提供设施对资源进行实时统计和调用链路分析。
-
根据预设的规则,结合对资源的实时统计信息,对流量进行控制。同时,Sentinel 提供开放的接口,方便您定义及改变规则。
-
Sentinel 提供实时的监控系统,方便您快速了解目前系统的状态。