SpringCloud学习–基础–4.1–Hystrix–介绍
1、介绍
1.1、分布式系统面临的问题
1.1.1、扇出
多个微服务互相调用的时候,如果A调用B、C,而B、C又继续调用其他微服务,这就是扇出(像一把扇子一样慢慢打开)。
1.1.2、扇出服务雪崩
如果某一个环节的服务出现故障或连接超时,就会导致前面的服务占用越来越多的资源,进而引起系统崩溃,就是"雪崩效应"。
对于高流量的应用来说,单一的后端依赖会导致服务器所有的资源都在几秒钟内饱和。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能影响整个应用程序或系统。
1.2、Hystrix介绍
Hystrix是一个用于处理分布式系统延迟和容错的开源库。分布式系统中,依赖避免不了调用失败,比如超时,异常等。Hystrix能保证在出现问题的时候,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。
Hystrix类似一个"断路器",当系统中异常发生时,断路器给调用返回一个符合预期的,可处理的FallBack,这样就可以避免长时间无响应或抛出异常,使故障不能再系统中蔓延,造成雪崩。
1.3、Hystrix能力
- 线程隔离
- 限流与过载保护
- 熔断
- 服务降级
- 容错
- 超时控制
- 监控运维。
2、线程隔离
用户请求不直接访问服务,而是使用线程池中空闲的线程访问服务,如果线程池已满调用将被立即拒绝,默认不采用排队,加速失败判定时间。
3、服务降级
- 优先保证核心服务,而非核心服务不可用或弱可用。
- 降级处理是在客户端完成的,与服务端没有关系。
- 降级针对的是服务熔断之后处理
- 降级一般是从整体负荷考虑,当某个服务熔断之后,服务器将不再被调用,此时客户端可以自己准备一个本地的FallBack回调,返回一个缺省值。这样做虽然服务水平下降,但好歹可用,比直接挂掉好。
- 及时返回服务调用失败的结果,让线程不因为等待服务而阻塞。
3.1、触发Hystrix服务降级的情况
- 线程池已满
- 请求超时
4、服务熔断
- 在服务熔断中,使用的熔断器,也叫断路器,其英文单词为:Circuit Breaker
- 熔断机制是应对雪崩效应的一种链路保护机制,一般存在于服务端;
- 当扇出链路的某个服务出现故障或响应超时,会进行服务降级,进而熔断该节点的服务调用,快速返回"错误"的相应信息(就是出现服务故障的预选方案),当检测到该节点微服务正常后,就恢复该节点的调用。
- Hystrix的熔断存在阈值,缺省是5秒内20次调用失败就会触发;
4.1、熔断机制的注解是
@HystrixCommand;
4.2、熔断机制原理
与家里使用的电路熔断原理类似
- 当如果电路发生短路的时候能立刻熔断电路,避免发生灾难。
- 在分布式系统中应用服务熔断后;服务调用方可以自己进行判断哪些服务反应慢或存在大量超时,可以针对这些服务进行主动熔断,防止整个系统被拖垮。
4.3、优点
- 可以实现弹性容错
- 当服务请求情况好转之后,可以自动重连。通过断路的方式,将后续请求直接拒绝,
- 一段时间(默认5秒)之后允许部分请求通过,如果调用成功则回到断路器关闭状态,否则继续打开,拒绝请求的服务。
4.4、服务熔断的场景
一般是某个服务故障或者异常引起,类似显示世界中的"保险丝",当某个异常条件被触发,直接熔断整个服务,而不是一直等到此服务超时。
4.5、Hystrix的熔断状态机模型
4.5.1、状态机有3个状态
- Closed:关闭状态
- 断路器关闭,所有请求都正常访问。
- Open:打开状态
- 断路器打开,所有请求都会被降级。
- Hystrix会对请求情况计数,当一定时间内失败请求百分比达到阈值,则触发熔断,断路器会完全打开。
- 默认
- 失败比例的阈值是50%
- 请求次数最少不低于20次。
- Half Open:半开状态
- 不是永久的,断路器打开后会进入休眠时间(默认是5S)。随后断路器会自动进入半开状态。此时会释放部分请求通过,若这些请求都是健康的,则会关闭断路器,否则继续保持打开,再次进行休眠计时。