一,服务容错的核心知识
1.1 雪崩效应
在微服务架构中,一个请求需要调用多个服务是非常常见的。如客户端访问A
服务,而
A
服务需要调用B 服务,
B
服务需要调用
C
服务,由于网络原因或者自身的原因,如果
B
服务或者
C
服务不能及时响应,
A服务将处于阻塞状态,直到
B
服务C服务响应。此时若有大量的请求涌入,容器的线程资源会被消耗完毕,导致服务瘫痪。服务与服务之间的依赖性,故障会传播,造成连锁反应,会对整个微服务系统造成灾难性的严重后果,这就是服务故障的
“
雪崩
”效应。
雪崩是系统中的蝴蝶效应导致其发生的原因多种多样,有不合理的容量设计,或者是高并发下某一个方法响应变慢,亦或是某台机器的资源耗尽。从源头上我们无法完全杜绝雪崩源头的发生,但是雪崩的根本原因来源于服务之间的强依赖,所以我们可以提前评估,做好
熔断,隔离,限流。
1.2 服务隔离
顾名思义,它是指将系统按照一定的原则划分为若干个服务模块,各个模块之间相对独立,无强依赖。当有故障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不波及其它模块,不影响整体的系统服务。
1.3 熔断降级
熔断这一概念来源于电子工程中的断路器(Circuit Breaker)。在互联网系统中,当下游服务因访问压力过大而响应变慢或失败,上游服务为了保护系统整体的可用性,可以暂时切断对下游服务的调用。这种牺牲局部,保全整体的措施就叫做熔断。
所谓降级,就是当某个服务熔断之后,服务器将不再被调用,此时客户端可以自己准备一个本地的
fallback
回调,返回一个缺省值。 也可以理解为兜底
1.4 服务限流
限流可以认为服务降级的一种,限流就是限制系统的输入和输出流量已达到保护系统的目的。一般来说系统的吞吐量是可以被测算的,为了保证系统的稳固运行,一旦达到的需要限制的阈值,就需要限制流量并采取少量措施以完成限制流量的目的。比方:推迟解决,拒绝解决,或者者部分拒绝解决等等。
二,Hystrix 介绍
Hystrix
是由
Netflflix开源的一个延迟和容错库,用于隔离访问远程系统、服务或者第三方库,防止级联失败,从而提升系统的可用性与容错性。
Hystrix
主要通过以下几点实现延迟和容错。
- 包裹请求:使用HystrixCommand包裹对依赖的调用逻辑,每个命令在独立线程中执行。这使用了设计模式中的“命令模式”。
- 跳闸机制:当某服务的错误率超过一定的阈值时,Hystrix可以自动或手动跳闸,停止请求该服务一段时间。
- 资源隔离:Hystrix为每个依赖都维护了一个小型的线程池(或者信号量)。如果该线程池已满,发往该依赖的请求就被立即拒绝,而不是排队等待,从而加速失败判定。
- 监控:Hystrix可以近乎实时地监控运行指标和配置的变化,例如成功、失败、超时、以及被拒绝的请求等。
- 回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑。回退逻辑由开发人员
- 自行提供,例如返回一个缺省值。
- 自我修复:断路器打开一段时间后,会自动进入“半开”状态。
三,restTemplate 使用hystrix实现服务熔断
3.1 引入springCloud 整合hystrix 依赖
<!--springCloud整合hystrix-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
3.2 开启熔断
在启动类
OrderApplication
中添加
@EnableCircuitBreaker
注解开启对熔断器的支持
package com.zjk.orderHystrix;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.boot.autoconfigure.domain.EntityScan;
import org.springframework.cloud.client.circuitbreaker.EnableCircuitBreaker;
import org.springframework.cloud.client.loadbalancer.LoadBalanced;
import org.springframework.cloud.netflix.eureka.EnableEurekaClient;
import org.springframework.cloud.openfeign.EnableFeignClients;
import org.springframework.context.annotation.Bean;
import org.springframework.web.client.RestTemplate;
@SpringBootApplication
@EntityScan("com.zjk.order.entity")
@EnableEurekaClient
//通过@EnableFeignClients 激活feign
@EnableFeignClients
//激活hystrix
@EnableCircuitBreaker
public class OrderHystrixApplication {
@Bean
@LoadBalanced
public RestTemplate restTemplate() {
return new RestTemplate();
}
public static void main(String[] args) {
SpringApplication.run(OrderHystrixApplication.class,args);
}
}
可以看到,我们类上的注解越来越多,在微服务中,经常会引入
@SpringBootApplication、@EnableDiscoveryClient、@EnableCircuitBreaker
于是
Spring就提供了一个组合注解:@SpringCloudApplication
package org.springframework.cloud.client;
import java.lang.annotation.Documented;
import java.lang.annotation.ElementType;
import java.lang.annotation.Inherited;
import java.lang.annotation.Retention;
import java.lang.annotation.RetentionPolicy;
import java.lang.annotation.Target;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.client.circuitbreaker.EnableCircuitBreaker;
import org.springframework.cloud.client.discovery.EnableDiscoveryClient;
@Target({ElementType.TYPE})
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@SpringBootApplication
@EnableDiscoveryClient
@EnableCircuitBreaker
public @interface SpringCloudApplication {
}
3.3配置熔断降级业务逻辑
package com.zjk.orderHystrix.controller;
import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import com.zjk.orderHystrix.command.OrderCommand;
import com.zjk.orderHystrix.entity.TbProduct;
import com.zjk.orderHystrix.feign.productFeignHttpClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.cloud.client.ServiceInstance;
import org.springframework.cloud.client.discovery.DiscoveryClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.client.RestTemplate;
import java.util.List;
@RestController
@RequestMapping(value = "/order")
public class OrderController {
@Autowired
private RestTemplate restTemplate;
@Autowired
private DiscoveryClient discoveryClient;
@Autowired
private productFeignHttpClient productFeignHttpClient;
/**
* 基于ribbon 的服务调用,使用服务提供者的服务名称
* @param Id
* @return
*/
@GetMapping(value = "/findByIdByRibbon/{Id}")
public TbProduct findByIdByRibbon(@PathVariable Long Id){
try {
//TbProduct byId = productFeignHttpClient.findById(Id);
TbProduct execute = new OrderCommand(restTemplate, Id).execute();
return execute;
}catch (Exception e){
e.printStackTrace();
}
return null;
}
/**
* 本地fallback回调
* @param Id
* @return
*/
@HystrixCommand(fallbackMethod = "orderFallBack")
@GetMapping(value = "/findByIdByHystrix/{Id}")
public TbProduct findByIdByHystrix(@PathVariable Long Id){
return restTemplate.getForObject("http://service-product/product/"+Id, TbProduct.class);
}
//降级方法
public TbProduct orderFallBack(Long id) {
TbProduct product = new TbProduct();
product.setId(-1l);
product.setProductName("熔断:触发降级方法");
return product;
}
有代码可知,为 findByIdByHystrix方法编写一个回退方法orderFallBack,该方法与 findByIdByHystrix方法具有相同的参数与返回值类型,该方法返回一个默认的错误信息。 在 Product
方法上,使用注解
@HystrixCommand
的fallbackMethod属性,指定熔断触发的降级方法是 orderFallBack。
- 因为熔断的降级逻辑方法必须跟正常逻辑方法保证:相同的参数列表和返回值声明。
- 在 findByIdByHystrix方法上 HystrixCommand(fallbackMethod = "orderFallBack") 用来 声明一个降级逻辑的方法
- 并且熔断方法不要写try ,如果方法发生异常就会被捕获。不能继续进行fallback() 方法的执行
3.4 超时设置
因为hystrix 默认超时时间为1秒,如果一秒内服务提供者没有返回数据,就会调用fallback 方法,但是一秒的时间对于系统来说有点快了,我们可以设置hystrix 的超时时间,来延长执行fallback方法。
server:
port: 9012
tomcat:
max-threads: 10 # 设置线程数为最大10个
spring:
application:
name: service-order-hystrix
datasource:
driver-class-name: com.mysql.jdbc.Driver
url: jdbc:mysql://localhost:3306/springclouddemo?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC
username: root
password: root
jpa:
database: MySQL
show-sql: true
open-in-view: true
eureka:
client:
service-url:
defaultZone: http://localhost:9003/eureka/,http://localhost:9004/eureka/
instance:
prefer-ip-address: true
instance-id: ${spring.cloud.client.ip-address}:${server.port} #向注册中心中展示注册服务id
lease-expiration-duration-in-seconds: 10 #eureka client 发送心跳给server端后,续约到期时间(默认为90秒)。
lease-renewal-interval-in-seconds: 5 # 发送心跳续约间隔(每一个心跳的间隔)
#修改ribbon的负载均衡策略 服务名-ribbon-NFLoadBalancer
service-product:
ribbon:
# NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RandomRule
ConnectTimeout: 250 # Ribbon的连接超时时间
ReadTimeout: 3000 # Ribbon的数据读取超时时间
OkToRetryOnAllOperations: true # 是否对所有操作都进行重试
MaxAutoRetriesNextServer: 1 # 切换实例的重试次数
MaxAutoRetries: 1 # 对当前实例的重试次数
feign:
client:
config:
service-product: # 服务提供者的服务名称
loggerLevel: FULL
logging:
level:
com.zjk.order.feign.productFeignHttpClient: debug #feign的自定义接口
hystrix:
command:
default:
execution:
isolation:
thread:
timeoutInMilliseconds: 3000
3.5 默认的fallback 降级方法
不能服务消费者每请求一个服务生产者接口都要写一个fallback 降级方法,可以设置一个默认的降级方法。
@RestController
@RequestMapping(value = "/order")
@DefaultProperties(defaultFallback = "orderFallBack")
public class OrderController {
@Autowired
private RestTemplate restTemplate;
@Autowired
private DiscoveryClient discoveryClient;
@Autowired
private productFeignHttpClient productFeignHttpClient;
/**
* 基于ribbon 的服务调用,使用服务提供者的服务名称
* @param Id
* @return
*/
@GetMapping(value = "/findByIdByRibbon/{Id}")
public TbProduct findByIdByRibbon(@PathVariable Long Id){
try {
//TbProduct byId = productFeignHttpClient.findById(Id);
TbProduct execute = new OrderCommand(restTemplate, Id).execute();
return execute;
}catch (Exception e){
e.printStackTrace();
}
return null;
}
/**
* 本地fallback回调
* @param Id
* @return
*/
@HystrixCommand
@GetMapping(value = "/findByIdByHystrix/{Id}")
public TbProduct findByIdByHystrix(@PathVariable Long Id){
return restTemplate.getForObject("http://service-product/product/"+Id, TbProduct.class);
}
@DefaultProperties(defaultFallback = "orderFallBack")
@HystrixCommand
四,验证
访问服务消费者,如果服务提供者可以正常提供服务的话,会返回正确的数据,如果我们将服务提供者故意停机,这时访问服务提供者不能提供服务就会执行fallback方法,这就是服务熔断,降级