熔断机制概述
熔路机制是应对雪崩效应的一种微服务链路的保护机制,当扇出某个微服务出错不可用或者响应时间过长时,回进行服务降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。
当检测到该节点下的微服务调用响应正常后,恢复调用链路。
在spring cloud框架中,熔断机制是通过Hystrix实现,Hystrix会监控微服务间的调用状况,当失败的调用到一定的阙值,缺省是5秒内20次调用失败,就会启动熔断机制,熔断机制的注解是@HystrixCommand
Hystrix官方流程图
导入依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
在主启动类中添加@EnableCircuitBreaker 注解
@SpringBootApplication
@EnableEurekaClient
@EnableCircuitBreaker //开启熔断
public class PaymentHystrix8010 {
public static void main(String[] args) {
SpringApplication.run(PaymentHystrix8010.class,args);
}
}
修改server实现类代码,完成服务熔断处理
@HystrixCommand(fallbackMethod = "paymentCricuitBreaker_fallback",commandProperties = {
@HystrixProperty(name = "circuitBreaker.enabled",value = "true"),//是否开启断路器
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),//请求次数
@HystrixProperty( name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"),//时间窗口期
@HystrixProperty( name = "circuitBreaker.errorThresholdPercentage",value = "60")//失败率达到多少跳闸
})
public String paymentCricuitBreaker(Integer id) {
if (id < 0) {
throw new RuntimeException("**********id不能为负数!!!");
}
String serilNumber = IdUtil.simpleUUID();
return Thread.currentThread().getName()+" 调用成功,流水号:"+serilNumber;
}
public String paymentCricuitBreaker_fallback(Integer id) {
return "id不能为负数,请稍后与重试!!!id:"+id;
}
Controller调用server方法
@GetMapping("/payment/hystrix/cricuit/{id}")
public String paymentCricuitBreaker(@PathVariable("id") Integer id) {
String result = paymentService.paymentCricuitBreaker(id);
return result;
}
测试
多次点击连接:http://localhost:8010/payment/hystrix/cricuit/-1,在点击http://localhost:8010/payment/hystrix/cricuit/1显示
5秒后再次访问
- @HystrixProperty(name = "circuitBreaker.enabled",value = "true"),//是否开启断路器
- @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),//请求次数
- @HystrixProperty( name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"),//时间窗口期
- @HystrixProperty( name = "circuitBreaker.errorThresholdPercentage",value = "60")//失败率达到多少跳闸
设计到断路器的三个重要参数:快照时间窗、请求总数阙值、错误百分比阙值
快照时间窗:断路器确定是否打开需要统计一些请求和错误数据,而统计的时间范围就是快照时间窗,默认为最近的10秒
请求总数阙值:在快照时间窗内,必须满足请求总数阙值才有资格熔断,默认为20,也就意味这在10秒内,如果该Hystrix命令的调用次数不足20次,即使所有的请求都超时或其他原因失败,断路器都不会打开。
错误百分比阙值:当请求总数在快照时间内超过了阙值,比如发生了30次的调用,如果在这30次调用中,有15次发生了超时异常,也就是超时50%的百分比,在默认设置50%阙值情况下,这时候就会将断路器打开。
断路器开启与关闭的条件
当满足一定阙值的时候(默认10秒内超过20个请求次数);
当失败率达到一定的时候(默认10秒内超过50%的请求失败);
达到以上阙值断路器就会开启,当开启的时候,所有请求将不会转发,一段时间之后(默认5秒),这个时候断路器是半开状态,会让其中一个请求进行转发。如果成功,断路器就会关闭,如果失败,断路器继续开启重复此操作。
断路器打开之后
在有请求调用的时候,将不会调用主逻辑,而是直接用降级fallback。通过断路器,实现了自动的发现错误并将降级逻辑切换为主逻辑,减少响应延迟的效果。
原来的主逻辑如何恢复?
对于这一问题Hystrix也为我们实现了自动恢复功能。
当断路器打开,对主逻辑进行熔断之后,Hystrix会启动一个休眠时间窗,在这个时间窗内,降级逻辑是临时的成为主逻辑,当休眠窗到期,断路器将进入半开状态,释放一次请求到原来的主逻辑上,如果此请求正常返回,那么断路器将继续闭合,主逻辑恢复,如果这次请求依旧有问题,断路器继续进入打开状态,休眠时间窗重新计时。