一,服务雪崩
多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B 和微服务C又调用其他的微服务,这就是所谓的 “扇出”、如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的 “雪崩效应”。对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒中内饱和。比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障,这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能取消整个应用程序或系统。
二,Hystrix断路器
Hystrix是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时,异常等,Hystrix能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。
“断路器” 本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个服务预期的,可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方法无法处理的异常,这样就可以保证了服务调用方的线程不会被长时间,不必要的占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。
三,服务熔断
熔断机制是对应雪崩效应的一种微服务链路保护机制。
当扇出链路的某个微服务不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回 错误的响应信息。当检测到该节点微服务调用响应正常后恢复调用链路。在SpringCloud框架里熔断机制通过Hystrix实现。Hystrix会监控微服务间调用的状况,当失败的调用到一定阈值,缺省是5秒内20次调用失败就会启动熔断机制。
熔断机制的注解是 @HystrixCommand。
四,配置Hystrix的熔断
新建一个springcloud-provider-dept-hystrix-8001模块,将之前的服务端模块的内容拷贝到这个模块中
添加依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
<version>2.2.5.RELEASE</version>
</dependency>
修改eureka实例的id
instance-id: springcloud-provider-dept8001-hystrix
修改DeptController
@RestController
public class DeptController {
@Autowired
private DeptService service;
//一旦调用服务方法失败并抛出了错误信息后
// 会自动调用HystrixCommand标注好的fallbackMethod调用类中指定方法
@GetMapping("/dept/get/{id}")
@HystrixCommand(fallbackMethod = "processHystrix_Get")
public Dept get(@PathVariable("id") Long id) {
Dept dept = service.queryById(id);
if (dept==null){// 如果没有fallbackMethod,会在此抛出异常
throw new RuntimeException("该id:"+id+"没有对应的的信息");
}
return dept;
}
public Dept processHystrix_Get(@PathVariable("id") Long id){
return new Dept().setDeptno(id)
.setDname("该id:"+id+"没有对应的信息,null--@HystrixCommand")
.setDb_source("no this database in MySQL");
}
}
修改主启动类添加新注解 @EnableCircuitBreaker
@SpringBootApplication
@EnableEurekaClient //本服务启动之后会自动注册进Eureka中!
@EnableDiscoveryClient //服务发现
@EnableCircuitBreaker //对hystrix 熔断机制的支持
public class DeptProviderHystrix8001 {
public static void main(String[] args) {
SpringApplication.run(DeptProviderHystrix8001.class,args);
}
}
启动项目,访问一个原先情况下会抛出错误的请求
上文中我们模拟的只是在服务发生异常时,自动调用fallbackMethod调用类中指定方法
加上@HystrixCommand注解 以及 fallbackMethod方法
表明这个方法再没有异常以及没有超时(hystrix默认1秒算超时)的情况,才返回正常的业务数据;否则,进入我们 fallbackMethod指定的方法,该方法能够在雪崩发生时,有效返回给用户界面友好的报错提示信息。
五,配置Hystrix的服务降级
服务降级就是整体资源快不够了,忍痛将某些服务先关掉,待渡过难关,再开启回来。服务降级处理是在客户端实现完成的,与服务端没有关系 。
Feign中默认集成了Hystrix,所以不需要引入hystrix依赖,但是要在yml文件中开启hystrix
修改springcloud-api工程,新建一个实现了FallbackFactory接口的类DeptClientServiceFallbackFactory
//降级 ~
@Component
public class DeptClientServiceFallbackFactory implements FallbackFactory {
@Override
public DeptClientService create(Throwable throwable) {
return new DeptClientService() {
@Override
public Dept queryById(Long id) {
// 当服务被降级就会调用
return new Dept()
.setDeptno(id)
.setDname("id=>"+id+"没有对应的信息,客户端提供了降级的信息,这个服务现在已经被关闭")
.setDb_source("没有数据~");
}
@Override
public List<Dept> queryAll() {
return null;
}
@Override
public boolean addDept(Dept dept) {
return false;
}
};
}
}
修改springcloud-api工程,DeptClientService接口在注解 @FeignClient中添加fallbackFactory属
性值
@Component
@FeignClient(value = "SPRINGCLOUD-PROVIDER-DEPT", fallbackFactory = DeptClientServiceFallbackFactory.class)
public interface DeptClientService {
@GetMapping("/dept/get/{id}")
public Dept queryById(@PathVariable("id") Long id); //根据id查询部门
@GetMapping("/dept/list")
public List<Dept> queryAll(); //查询所有部门
@PostMapping(value = "/dept/add")
public boolean addDept(Dept dept); //添加一个部门
}
当某个服务被降级时,@FeignClient会自动为我们调用fallbackFactory指定的类。
服务降级与熔断都是为了防止系统崩溃,让用户体验到的是某些功能暂时不可用,服务熔断一般是某个服务故障引起,而服务降级一般是从整体负荷考虑。
六,配置Hystrix的服务监控
Hystrix提供了准实时的调用监控(Hystrix Dashboard),Hystrix会持续地记录所有通过Hystrix发起的请求的执行信息,并以统计报表和图形的形式展示给用户,包括每秒执行多少请求,多少成功,多少失败等等。
新建工程springcloud-consumer-hystrix-dashboard-9001,将之前服务端的内容拷贝到这个新建的模块下
新增依赖
<!--Hystrix-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
<version>2.2.5.RELEASE</version>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
<version>2.2.5.RELEASE</version>
</dependency>
修改application.yaml配置
server:
port: 9001
#Eureka配置
eureka:
client:
register-with-eureka: false #false表示不向注册中心注册自己
service-url:
defaultZone: http://eureka7001.com:7001/eureka/,http://eureka7002.com:7002/eureka/,http://eureka7003.com:7003/eureka/
hystrix:
dashboard:
proxy-stream-allow-list: "localhost"
修改主启动类
@SpringBootApplication
@EnableHystrixDashboard
public class DeptConsumerDashBoardApp9001 {
public static void main(String[] args) {
SpringApplication.run(DeptConsumerDashBoardApp9001.class,args);
}
}
在需要监控的服务端中新增依赖
<!--actuator监控信息完善-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
在 springcloud-provider-dept-hystrix-8001 启动类中增加一个bean
@Bean
public ServletRegistrationBean hystrixMetricsStreamServlet() {
ServletRegistrationBean registration = new ServletRegistrationBean(new HystrixMetricsStreamServlet());
registration.addUrlMappings("/actuator/hystrix.stream");
return registration;
}
启动项目,访问http://localhost:9001/hystrix监控页面
Delay : 该参数用来控制服务器上轮询监控信息的延迟时间,默认为2000毫秒,可以通过配置该属性来降低客户端的网络和CPU消耗
Title : 该参数对应了头部标题HystrixStream之后的内容,默认会使用具体监控实例URL,可以通过配置该信息来展示更合适的标题。
添加监控地址http://localhost:8001/actuator/hystrix.stream
图中的实心圆:有两种含义,他通过颜色的变化代表了实例的健康程度它的健康程度从绿色<黄色<橙色<红色 递减该实心圆除了颜色的变化之外,它的大小也会根据实例的请求流量发生变化,流量越大,该实心圆就越大,所以通过该实心圆的展示,就可以在大量的实例中快速发现故障实例和高压力实例。
曲线用来记录2分钟内流量的相对变化,可以通过它来观察到流量的上升和下降趋势