Hystrix的引用以及是怎么解决服务雪崩
一、概述
1.分布式系统面临的问题
复杂的分布式系统结构中的应用程序有数十个依赖关系,每个依赖关系在某些时候将不可避免地失败
2.服务雪崩
2.1 雪崩的出现
多个微服务之间调用地时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,这就是所谓的“扇出”。如果扇出的链路上某个微服务调用响应的时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的“雪崩效应”。
2.2 进一步恶化
对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒钟内饱和。比失败更糟糕的是,这些应用还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理,以便单个已到来关系的失败,不能取消整个应用程序或系统。
2.3 雪崩
所以,通常当你发现一个模块下的某个实例失败后,这时候这个模块依然还会接受流量,然后这个有问题的模块还调用了其他的模块,这样就会发生级联故障,或者叫雪崩。
3. Hystrix的引用
3.1 Hystrix概述
Hystrix是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免地会调用失败,比如超时,异常等。Hystrix能够保证在一个依赖出问题地情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统地弹性。
3.2 断路器
“断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器地故障监控(类似熔断保险丝),向调用方返回一个符合预期的,可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要的占用,从而避免了故障在分布式系统中蔓延,乃至雪崩。
二、Hystrix重要概念(星标,面试会考哦)
1. 服务降级(FallBack)
1.1 返回一个备选响应
比如说服务器忙,请稍后再试,不让客户端等待并立刻返回一个友好提示,fallback
1.2 那些情况会触发降级
- 程序运行异常
- 超时
- 服务器熔断触达服务降级
- 线程池/信号量打满也会导致服务降级
2. 服务熔断
2.1 服务熔断理解(保险丝)
类比保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示
3. 服务限流
3.1案例理解
秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟N个,有序进行。