概述
分布式系统面临的问题
复杂分布式体系结构中的应用程序有数十个依赖关系,每个依赖关系在某些时候将不可避免的失败!
如果服务 I 超时就会引起服务雪崩
服务雪崩
多个微服务之间调用的时候,假设微服务A调用微服务B和微服务C,微服务B 和微服务C又调用其他的微服务,这就是所谓的 “扇出”、如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务A 的调用就会占用越来越多的系统资源,进而引起系统崩溃,所谓的 “雪崩效应”。
对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒中内饱和。比失 败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张, 导致整个系统发生更多的级联故障,这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系 的失败,不能取消整个应用程序或系统。
我们需要 ·弃车保帅·
什么是Hystrix
Hystrix是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调 用失败,比如超时,异常等,Hystrix能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避 免级联故障,以提高分布式系统的弹性。
“断路器” 本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方返回一个服务预期的,可处理的备选响应(FallBack),而不是长时间的等待或者抛出 调用方法无法处理的异常,这样就可以保证了服务调用方的线程不会被长时间,不必要的占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。
能干嘛
- 服务降级
- 服务熔断
- 服务限流
- 接近实时的监控
- .....
官网资料
https://github.com/Netflix/Hystrix/wiki
服务熔断
概念
熔断机制是对应雪崩效应的一种微服务链路保护机制。
当扇出链路的某个微服务不可用或者响应时间太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后恢复调用链路。在SpringCloud 框架里熔断机制通过Hystrix实现。Hystrix会监控微服务间调用的状况,当失败的调用到一定阈值,缺省是5秒内20次调用失败就会启动熔断机制。
熔断机制的注解是 @HystrixCommand
编写代码
参考springcloud-provider-dept-8001
- 新建springcloud-provider-dept-hystrix-8001
- 将之前8001的所有东西拷贝一份
修改pom
添加Hystrix的依赖
<!-- https://mvnrepository.com/artifact/org.springframework.cloud/spring-cloud-starter-hystrix -->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix</artifactId>
<version>1.4.7.RELEASE</version>
</dependency>
修改yml
修改eureka实例的id
修改DeptController
1、@HystrixCommand 报异常后如何处理
//一旦调用服务方法失败并抛出了错误信息后
// 会自动调用HystrixCommand标注好的fallbackMethod调用类中指定方法
@HystrixCommand(fallbackMethod = "processHystrix_Get")
2、代码内容
@RestController
public class DeptController {
@Autowired
private DeptService deptService;
@GetMapping("/dept/get/{id}")
//一旦调用服务方法失败并抛出了错误信息后
// 会自动调用HystrixCommand标注好的fallbackMethod调用类中指定方法
@HystrixCommand(fallbackMethod = "processHystrix_Get")
public Dept queryById(@PathVariable("id") Long id) {
Dept dept = deptService.queryById(id);
if (dept == null) {
throw new RuntimeException("该id:" + id + "没有对应的的信息");
}
return dept;
}
public Dept processHystrix_Get(@PathVariable("id") Long id) {
return new Dept().setDeptno(id)
.setDname("该id:" + id + "没有对应的信息,null--@HystrixCommand")
.setDb_source("no this database in MySQL");
}
}
修改主启动类添加新注解 @EnableCircuitBreaker
3、修改主启动类的名称为 DeptProviderHystrix_8001
4、代码
@SpringBootApplication
@MapperScan("com.jia.springcloud.dao")
@EnableEurekaClient // 在服务启动后自动注册到 Eureka 中
@EnableDiscoveryClient // 服务发现
@EnableCircuitBreaker //对hystrix 熔断机制的支持 【==========new=======】
public class DeptProviderHystrix_8001 {
public static void main(String[] args) {
SpringApplication.run(DeptProviderHystrix_8001.class, args);
}
}
测试
1、启动Eureka集群
2、启动主启动类 DeptProviderHystrix8001
3、启动客户端 springcloud-consumer-dept-80
4、访问 http://localhost/consumer/dept/get/111
服务降级
概念
整体资源快不够了,忍痛将某些服务先关掉,待渡过难关,再开启回来
服务降级处理是在客户端实现完成的,与服务端没有关系
编写代码
修改springcloud-api工程
根据已经有的DeptClientService接口新建一个实现了 FallbackFactory 接口的类 DeptClientServiceFallbackFactory
【注意:这个类上需要@Component注解!!!】
@Component //千万不要忘记
public class DeptClientServiceFallbackFactory implements FallbackFactory<DeptClientService> {
@Override
public DeptClientService create(Throwable throwable) {
return new DeptClientService() {
@Override
public Dept queryById(Long id) {
return new Dept().setDeptno(id)
.setDname("该id:" + id + "没有对应的信息,Consumer客户端提供的降级信息,此刻服务Provider已经关闭")
.setDb_source("no this database in MySQL");
}
@Override
public List<Dept> queryAll() {
return null;
}
@Override
public Boolean addDept(Dept dept) {
return false;
}
};
}
}
修改springcloud-api工程
DeptClientService接口在注解 @FeignClient 中添加 fallbackFactory 属 性值
@Component
@FeignClient(value = "SPRINGCLOUD-PROVIDER-DEPT", fallbackFactory = DeptClientServiceFallbackFactory.class)
public interface DeptClientService {
@GetMapping("/dept/get/{id}")
Dept queryById(@PathVariable("id") Long id);
@GetMapping("/dept/list")
List<Dept> queryAll();
@PostMapping("/consumer/dept/add")
Boolean addDept(Dept dept);
}
springcloud-consumer-dept-feign-80工程修改YML
server:
port: 80
feign:
hystrix:
enabled: true
#Eureka配置
eureka:
client:
register-with-eureka: false #false表示不向注册中心注册自己
service-url:
defaultZone: http://eureka7001.com:7001/eureka/,http://eureka7002.com:7002/eureka/,http://eureka7003.com:7003/eureka/
测试
- 启动eureka集群
- 启动 springcloud-provider-dept-hystrix-8001
- 启动 springcloud-consumer-dept-feign-80
- 正常访问测试 http://localhost/consumer/dept/get/1
- 故意关闭微服务启动 springcloud-provider-dept-hystrix-8001
- 客户端自己调用提示 http://localhost/consumer/dept/get/1
此时服务端provider已经down了,但是我们做了服务降级处理,让客户端在服务端不可用时 也会获得提示信息而不会挂起耗死服务器。
小结
服务熔断(服务端):一般是某个服务故障或者异常引起,类似现实世界中的 “保险丝” , 当某个异常条件被触发, 直接熔断整个服务,而不是一直等到此服务超时!
服务降级(客户端):所谓降级,一般是从整体负荷考虑,就是当某个服务熔断之后,服务器将不再被调用,此时客户端可以自己准备一个本地的fallback回调,返回一个缺省值。这样做,虽然服务水平下降,但好歹可用,比直接挂掉要强。
服务监控
概念
服务监控 hystrixDashboard
除了隔离依赖服务的调用以外,Hystrix还提供了准实时的调用监控(Hystrix Dashboard),Hystrix会 持续地记录所有通过Hystrix发起的请求的执行信息,并以统计报表和图形的形式展示给用户,包括每秒 执行多少请求,多少成功,多少失败等等。
Netflix通过hystrix-metrics-event-stream项目实现了对以上指标的监控,SpringCloud也提供了Hystrix Dashboard的整合,对监控内容转化成可视化界面!
编写代码
新建工程springcloud-consumer-hystrix-dashboard-9001
Pom.xml
复制之前80项目的pom文件,新增以下依赖!
<!--Hystrix-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix</artifactId>
<version>1.4.7.RELEASE</version>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix-dashboard</artifactId>
<version>1.4.7.RELEASE</version>
</dependency>
application.yaml配置
server:
port: 9001
#暴露全部的监控信息
hystrix:
dashboard:
proxy-stream-allow-list: "*"
主启动类改名 + 新注解 @EnableHystrixDashboard
@SpringBootApplication
@EnableHystrixDashboard
public class DeptConsumerDashboard_9001 {
public static void main(String[] args) {
SpringApplication.run(DeptConsumerDashboard_9001.class, args);
}
}
所有的Provider微服务提供类(8001/8002/8003) 都需要监控依赖配置
<!--actuator监控信息完善-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
启动springcloud-consumer-hystrix-dashboard-9001该微服务监控消费端
测试
- 启动eureka集群
- 启动springcloud-consumer-hystrix-dashboard-9001
- 在 springcloud-provider-dept-hystrix-8001 启动类中增加一个bean
@SpringBootApplication @MapperScan("com.jia.springcloud.dao") @EnableEurekaClient // 在服务启动后自动注册到 Eureka 中 @EnableDiscoveryClient // 服务发现 @EnableCircuitBreaker //对hystrix 熔断机制的支持 【==========new=======】 public class DeptProviderHystrix_8001 { public static void main(String[] args) { SpringApplication.run(DeptProviderHystrix_8001.class, args); } @Bean public ServletRegistrationBean hystrixMetricsStreamServlet() { ServletRegistrationBean registration = new ServletRegistrationBean(new HystrixMetricsStreamServlet()); registration.addUrlMappings("/actuator/hystrix.stream"); return registration; } }
- 启动 springcloud-provider-dept-hystrix-8001
监控测试
- 多次刷新 http://localhost:8001/dept/get/1
- 观察监控窗口,就是那个豪猪页面
- 添加监控地址
- Delay : 该参数用来控制服务器上轮询监控信息的延迟时间,默认为2000毫秒,可以通过配置该属性来降低客户端的网络和CPU消耗
- Title : 该参数对应了头部标题HystrixStream之后的内容,默认会使用具体监控实例URL,可以通过配置该信息来展示更合适的标题。
- 监控结果
- 如何看
- 7色
- 一圈
- 实心圆:公有两种含义,他通过颜色的变化代表了实例的健康程度
- 它的健康程度从绿色<黄色<橙色<红色 递减
- 该实心圆除了颜色的变化之外,它的大小也会根据实例的请求流量发生变化,流量越 大,该实心圆就越大,所以通过该实心圆的展示,就可以在大量的实例中快速发现故障实例和高压力实例。
- 一线
- 曲线:用来记录2分钟内流量的相对变化,可以通过它来观察到流量的上升和下降趋势!
- 整图说明
- 添加监控地址