基于分布式中因某个微服务不可用而导致的服务雪崩等问题,为防止异常传递进而导致的异常传播等问题,需要实现当某个微服务发生异常时不因为该服务异常而影响依赖该服务的其他微服务正常运行,springcloud通过使用hystrix组件来解决。
思考:服务异常了如何保证其他服务不受影响?
场景:
服务提供者异常时调用者因等待提供者返回信息而一直同步阻塞着,消耗消费者服务资源,随着调用的越多消耗越大,直至消费者服务资源被耗尽导致消费者服务不可用。
解决:
- 设置请求超时时间,服务请求超过预设的时间自动视为请求失败,关闭对应线程释放系统资源
- 服务提供者异常后消费者记录对应信息,若多次请求皆是异常则达到一定次数后再有该类请求直接返回异常信息不在请求服务提供者降低资源消耗
- 每个请求设置独立的资源(线程池,内存、连接池等),这样某个请求异常了也不会导致整个服务不可用(参考舱壁模式)。
Hystrix是基于此方案进行了更加细化的策略来解决服务间异常传播的问题。
熔断:
提供者异常时消费者记录该信息,请求异常达到一定次数或一定比例时不再调用提供者,直接返回异常信息。
降级:
消费者请求提供者,提供者返回请求异常,启动备用方案执行(例:去星巴克买咖啡,发现星巴克排队的人太多了要等好久就去瑞星买一杯)。
通常熔断和降级都是联合使用的,当我们的服务请求异常我们就走备用逻辑,当多次请求提供者都异常,之后的请求就直接走备用逻辑不在向提供者发出请求。
简示图: