多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B和微服务C又调用其它的微服务,这就是所谓的“扇出”。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃。
Hystrix
1.定义:一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时、异常等,Hystrix能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。
2."断路器”本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。
3.Hystrix重要概念:①服务降级(fallback)②服务熔断(break)③服务限流(flowlimit)。
4.服务降级:服务器忙,请稍后再试,不让客户端等待并立刻返回一个友好提示,fallback;当①程序运行异常②超时③服务熔断触发服务降级④线程池/信号量也会导致服务降级会产生该情况。
5.服务熔断:类比保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示;流程为:服务的降级->进而熔断->恢复调用链路。
6.服务限流:某一时刻进入该服务请求次数过多;将这些请求分批进入处理。
7.降级配置(@HystrixCommand):设置自身调用超时时间的峰值,峰值内可以正常运行, 超过了需要有兜底的方法处理,做服务降级fallback。
服务端添加@EnableCircuitBreaker注解;客户端添加@EnableHystrix注解
服务端:
/**
* 正常访问
* @param id
* @return
*/
public String paymentInfo_OK(Integer id){
return "线程池: "+Thread.currentThread().getName()+ "; paymentInfo_OK,id: "+id;
}
@HystrixCommand(fallbackMethod = "paymentInfo_TimeOutHandler",commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds",value = "3000")
})
public String paymentInfo_TimeOut(Integer id){
int timeNumber= 2;
//int i = 3/0;
try {
TimeUnit.SECONDS.sleep(2);
}catch (InterruptedException e){
e.printStackTrace();
}
return "线程池: "+Thread.currentThread().getName()+ "; paymentInfo_TimeOut,id: "+id+ "耗时(秒):"+timeNumber;
}
/**
* 出现超时异常等情况调用的方法
* @param id
* @return
*/
public String paymentInfo_TimeOutHandler(Integer id)
{
return "线程池: "+Thread.currentThread().getName()+" 8081系统繁忙、请求超时或者运行报错,请稍后再试,id: "+id;
}
客户端:
@GetMapping("/consumer/payment/hystrix/ok/{id}")
public String paymentInfo_OK(@PathVariable("id") Integer id) {
String result = consumerHystrixService.consumerInfo_OK(id);
return result;
}
@HystrixCommand(fallbackMethod ="paymentTimeOutFallbackMethod",commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds" ,value = "1500")
})
@GetMapping("/consumer/payment/hystrix/timeout/{id}")
public String paymentInfo_TimeOut(@PathVariable("id") Integer id) {
int age = 10/0;
String result = consumerHystrixService.consumerInfo_TimeOut(id);
return result;
}
/**
* 出现超时异常等情况调用的方法
* @param id
* @return
*/
public String paymentTimeOutFallbackMethod(@PathVariable("id") Integer id){
return "我是消费者80,对方支付系统繁忙请10秒钟后再试或者自己运行出错请检查自己";
}
8。如果每一个方法都配置一个@HystrixCommand配那么代码将膨胀和繁多,所以需要引入@DefaultProperties来已经全局统一管理降级
@DefaultProperties(defaultFallback = "payment_Global_FallbackMethod")
public class OrderHystirxController {
/* @HystrixCommand(fallbackMethod ="paymentTimeOutFallbackMethod",commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds" ,value = "1500")
})*/
@GetMapping("/consumer/payment/hystrix/timeout/{id}")
@HystrixCommand
public String paymentInfo_TimeOut(@PathVariable("id") Integer id) {
int age = 10/0;
String result = consumerHystrixService.consumerInfo_TimeOut(id);
return result;
}
/**
* 下面是全局fallback方法
* @return
*/
public String payment_Global_FallbackMethod(){
return "Global异常处理信息,请稍后再试!";
}
}
9.为了将异常处理和逻辑代码分开我们需要在@FeignClient(value = “CLOUD-PROVIDER-HYSTRIX-PAYMENT”,fallback =ConsumerFallbackService.class) 写一个类是实现这个接口(统一为接口里面的方法进行异常处理)来除去服务端宕机情况
10.服务熔断:熔断机制是应对雪崩效应的一种微服务链路保护机制。当扇出链路的某个微服务出错不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后,恢复调用链路。
11.熔断类型:
①熔断打开(请求不再调用当前服务,内部设置一般为MTTR(平均故障处理时间),当打开长达导所设时钟则进入半熔断状态)
②熔断关闭(熔断关闭后不会对服务进行熔断)
③熔断半开(部分请求根据规则调用当前服务,如果请求成功且符合规则则认为当前服务恢复正常,关闭熔断)
12.涉及到断路器的三个重要参数:快照时间窗、请求总数阀值、错误百分比阀值。
①:快照时间窗:断路器确定是否打开需要统计一些请求和错误数据,而统计的时间范围就是快照时间窗,默认为最近的10秒。
②:请求总数阀值:在快照时间窗内,必须满足请求总数阀值才有资格熔断。默认为20,意味着在10秒内,如果该hystrix命令的调用次数不足20次,
即使所有的请求都超时或其他原因失败,断路器都不会打开。
③:错误百分比阀值: 当请求总数在快照时间窗内超过了阀值,比如发生了30次调用,如果在这30次调用中,有15次发生了超时异常,也就是超过
50%的错误百分比,在默认设定50%阀值情况下,这时候就会将断路器打开。
@HystrixCommand(fallbackMethod = "paymentCircuitBreaker_fallback",commandProperties = {
@HystrixProperty(name = "circuitBreaker.enabled",value = "true"),// 是否开启断路器
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),// 请求次数
@HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"), // 时间窗口期
@HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "60"),// 失败率达到多少后跳闸
})
public String paymentCircuitBreaker(@PathVariable("id") Integer id){
if(id < 0) {
throw new RuntimeException("******id 不能负数");
}
String serialNumber = IdUtil.simpleUUID();
return Thread.currentThread().getName()+"\t"+"调用成功,流水号: " + serialNumber;
}
public String paymentCircuitBreaker_fallback(@PathVariable("id") Integer id) {
return "id 不能负数,请稍后再试,id: " +id;
}
13.断路器开启或者关闭的条件:
①:当满足一定的阈值的时候(默认10秒钟超过20个请求次数)
②:当失败率达到一定的时候(默认10秒内超过50%的请求次数)
③:到达以上阈值,断路器将会开启
④:当开启的时候,所有请求都不会进行转发
⑤:一段时间之后(默认5秒),这个时候断路器是半开状态,会
让其他一个请求进行转发.如果成功,断路器会关闭,若失
败,继续开启.重复4和5
14.熔断器流程:再有请求调用的时候,将不会调用主逻辑,而是直接调用降级fallback。通过断路器,实现了自动地发现错误并将降级逻辑切换为主逻辑,减少响应延迟的效果。
15.主逻辑的恢复:hystrix也为我们实现了 自动恢复功能。当断路器打开,对主逻辑进行熔断之后,hystrix会启动一 个休眠时间窗,在这个时间窗内,降级逻辑是临时的成为主逻辑,当休眠时间窗到期,断路器将进入半开状态,释放-次请求到原来的主逻辑 上,如果此次请求正常返回,那么断路器将继续闭合,主逻辑恢复,如果这次请求依然有问题,断路器继续进入打开状态,休眠时间窗重新计时。