- 服务雪崩
多个微服务之间调用的时候,如果某个微服务的响应时间过长或不可用,调用方会占用越来越多的系统资源,进而引起系统崩溃,这就是所谓的雪崩效应。
- 解决方案
hystrix用于处理分布式系统的延迟和容错的开源库,他能保证一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式的系统的弹性
短路器本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个符合预期的,可处理的备选响应(FallBack),而不是长时间的等待或者调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统的蔓延,乃至雪崩
- 作用
- 降级:服务器忙,请稍后再试,然后给用户一个友好提示
- 熔断:达到最大服务访问后,直接拒绝访问,然后再调用降级方法
- 限流:1秒N个,有序进行
- 服务熔断
一开始断路器为关闭状态,一但超过阈值,则断路器打开,过了打开的超时后,会产生关闭,但发现又能正常运行,则关闭断路器
- 说明
- tomcat默认10个工作线程,所以高并发会导致其它请求变慢
- 消费方和生产方都可以配置断路器
编码
- 改pom
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
- 在main类加注解
@SpringBootApplication
@EnableEurekaClient
@EnableHystrix
public class PaymentMain8080 {
public static void main(String[] args) {
SpringApplication.run(PaymentMain8080.class, args);
}
}
- service层加注解
@Override
@HystrixCommand(fallbackMethod = "message", commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "3000")
})
public String timeout(Long id) {
try {
TimeUnit.SECONDS.sleep(6);
} catch (Exception e) {
return e.getMessage();
}
return "success";
}
public String message(Long id) {
return Thread.currentThread().getName();
}
配置通用的错误处理
@Service
@Slf4j
@DefaultProperties(defaultFallback = "message")
public class PaymentServiceImpl implements PaymentService {
对一个服务全局配置断路器,可以再feign层调用
- 改yml
feign:
hystrix:
enabled: true
- feign层加fallback
@Component
@FeignClient(value = "CLOUD-PAYMENT-SERVICE", fallback = PaymentFeginFallback.class)
public interface PaymentFeign {
@GetMapping("/payment/discovery")
CommonResult discovery();
- 实现fallback对应类
@Component
public class PaymentFeginFallback implements PaymentFeign {
CommonResult error() {
return new CommonResult(500, "内部错误");
}
@Override
public CommonResult discovery() {
return error();
}
}
- 服务熔断编码
@HystrixCommand(fallbackMethod = "message", commandProperties = {
//是否开启断路器
@HystrixProperty(name = "circuitBreaker.enabled", value = "true"),
//请求次数
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold", value = "10"),
//短路多久可以尝试恢复
@HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds", value = "10000"),
//识别率达到多少后跳闸
@HystrixProperty(name = "circuitBreaker.errorThresholdPercentage", value = "60"),
})
public Payment getPaymentById(Long id) {
return paymentDao.getPaymentById(id);
}
Hystrix Dashboard
持续记录hystrix发起的请求的执行信息,并以统计报表和图形的形式展示给用户,包括每秒执行多少请求,多少成功,多少失败。netflix通过hystrix-metrics-event-stream项目实现对以上指标的监控,spring cloud也提供了hystrix dashboard的整和合,对监控内容转化成可视化界面
- pom
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>
- yml
server:
port: 9001
- main方法
@SpringBootApplication
@EnableHystrixDashboard
public class DashboardMain {
public static void main(String[] args) {
SpringApplication.run(DashboardMain.class, args);
}
}
- 被监控方添加
@Bean
public ServletRegistrationBean getServlet() {
HystrixMetricsStreamServlet servlet = new HystrixMetricsStreamServlet();
ServletRegistrationBean bean = new ServletRegistrationBean(servlet);
bean.setLoadOnStartup(1);
bean.addUrlMappings("/hystrix.stream");
bean.setName("HystrixMetricsStreamServlet");
return bean;
}
- 测试
- 点击监控