Spring Cloud微服务学习系列10 熔断器Hystrix的使用雪崩问题服务降级问题

最新推荐文章于 2023-07-30 15:40:34 发布

一只胡说八道的猴子

最新推荐文章于 2023-07-30 15:40:34 发布

阅读量491

点赞数

分类专栏： SpringCloud

本文链接：https://blog.csdn.net/pjh88/article/details/114282794

版权

SpringCloud 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

熔断器Hystrix

Hystrix是什么？

Hystrix 在英文里面的意思是豪猪，它的logo 看下面的图是一头豪猪，它在微服务系统中是一款提供保护机制的组件，和eureka一样也是由netflix公司开发。
主页：https://github.com/Netflix/Hystrix/

在这里插入图片描述

那么Hystrix的作用是什么呢？具体要保护什么呢？
Hystrix是Netflix开源的一个延迟和容错库，用于隔离访问远程服务、第三方库，防止出现级联失败。

雪崩问题

微服务中，服务间调用关系错综复杂，一个请求，可能需要调用多个微服务接口才能实现，会形成非常复杂的调用链路：

在这里插入图片描述

如图，一次业务请求，需要调用A、P、H、I四个服务，这四个服务又可能调用其它服务。
如果此时，某个服务出现异常：

在这里插入图片描述

例如：微服务 I 发生异常，请求阻塞，用户请求就不会得到响应，则tomcat的这个线程不会释放，于是越来越多的用户请求到来，越来越多的线程会阻塞：

在这里插入图片描述

服务器支持的线程和并发数有限，请求一直阻塞，会导致服务器资源耗尽，从而导致所有其它服务都不可用，形成雪崩效应。
这就好比，一个汽车生产线，生产不同的汽车，需要使用不同的零件，如果某个零件因为种种原因无法使用，那么就会造成整台车无法装配，陷入等待零件的状态，直到零件到位，才能继续组装。此时如果有很多个车型都需要这个零件，那么整个工厂都将陷入等待的状态，导致所有生产都陷入瘫痪。一个零件的波及范围不断扩大。

Hystrix解决雪崩问题的手段主要是服务降级，包括：

线程隔离
**
用户请求不直接访问服务，而是使用线程池中空闲的线程访问服务，加速失败判断时间。**
**
**服务熔断 **
**
及时返回服务调用失败的结果，让线程不因为等待服务而阻塞。

雪崩问题案例实践

1.所需的jar包

 <dependency>
             <groupId>org.springframework.cloud</groupId>
             <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
         </dependency>

2.在对应的SpringBoot启动类上添加@EnableCircuitBreaker 注解，开启熔断

@EnableEurekaClient
@SpringBootApplication
@EnableCircuitBreaker
public class ConsumerApplication {
    public static void main(String[] args) {
        SpringApplication.run(ConsumerApplication.class,args);
    }
}

可以看到，我们类上的注解越来越多，在微服务中，经常会引入上面的三个注解，于是Spring就提供了一个组合注解：@SpringCloudApplication
在这里插入图片描述

用改注解替代上面三个组合注解

@SpringCloudApplication
public class ConsumerApplication {
    public static void main(String[] args) {
        SpringApplication.run(ConsumerApplication.class,args);
    }
}

3.编写降级处理方案

当目标服务的调用出现故障，我们希望快速失败，给用户一个友好提示。因此需要提前编写好失败时的降级处理逻辑，要使用HystrixCommand来完成。

示例代码

package com.pjh.user.Controller;

import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import com.pjh.user.pojo.user;
import org.apache.catalina.User;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.cloud.client.ServiceInstance;
import org.springframework.cloud.client.discovery.DiscoveryClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.client.RestTemplate;

import java.util.List;

@RestController
@RequestMapping("/consumer")
public class ConsumerController {
    @Autowired
    private RestTemplate restTemplate;
    @Autowired(required = false)
    private DiscoveryClient discoveryClient;
    @GetMapping("/{id}")
    @HystrixCommand(defaultFallback ="queryByIdFallBack" )
    public user QueryForId(@PathVariable String id){
        String url = "http://producer-service/user/" + id;
        return restTemplate.getForObject(url, user.class);
    }
    public String queryByIdFallBack(){
        return "网络拥挤请稍后再试！！";
    }
}

重点解释

要注意；因为熔断的降级逻辑方法必须跟正常逻辑方法保证：相同的参数列表和返回值声明。
失败逻辑中返回User对象没有太大意义，一般会返回友好提示。所以把queryById的方法改造为返回String，反正也是Json数据。这样失败逻辑中返回一个错误说明，会比较方便。

**
说明：
**
@HystrixCommand(fallbackMethod = “queryByIdFallBack”)：用来声明一个降级逻辑的方法

测试：
当 user-service 正常提供服务时，访问与以前一致。但是当将 user-service 停机时，会发现页面返回了降级处理信息：
在这里插入图片描述

默认的FallBack（）

刚才把fallback写在了某个业务方法上，如果这样的方法很多，那岂不是要写很多。所以可以把Fallback配置加在类上，实现默认fallback；
改造刚才的案例如下：

@RestController
@RequestMapping("/consumer")
@DefaultProperties(defaultFallback ="queryByIdFallBack" )
public class ConsumerController {
    @Autowired
    private RestTemplate restTemplate;
    @Autowired(required = false)
    private DiscoveryClient discoveryClient;
    @GetMapping("/{id}")

    public user QueryForId(@PathVariable String id){
        String url = "http://producer-service/user/" + id;
        return restTemplate.getForObject(url, user.class);
    }
    public String queryByIdFallBack(){
        return "网络拥挤请稍后再试！！";
    }
}

注意事项：

DefaultProperties(defaultFallback = “defaultFallBack”)：在类上指明统一的失败降级方法；该类中所有方法返回类型要与处理失败的方法的返回类型一致

超时设置

在之前的案例中，请求在超过1秒后都会返回错误信息，这是因为Hystrix的默认超时时长为1，我们可以通过配置修改这个值；修改 application.yml 添加如下配置：

hystrix:
  command:
    default:
      execution:
        isolation:
          thread:
            timeoutInMilliseconds=2000:

这个配置会作用于全局所有方法。为了方便复制到yml配置文件中，可以复制

hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=2000

到yml文件中会自动格式化后再进行修改。

为了触发超时，可以在提供服务方的方法中休眠2秒；
测试：

package com.pjh.user.Service;
import com.pjh.user.Mapper.UserMapper;
import com.pjh.user.pojo.User;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;
@Service
public class UserService {
    @Autowired(required = false)
    private UserMapper userMapper;
    public User queryForId(Long id) throws InterruptedException {
        Thread.sleep(3000);
      return   userMapper.selectByPrimaryKey(id);
    }

}

在这里插入图片描述

线程隔离

原理示意图

在这里插入图片描述

示意图解读

Hystrix为每个依赖服务调用分配一个小的线程池，如果线程池已满调用将被立即拒绝，默认不采用排队，加速失败判定时间。

用户的请求将不再直接访问服务，而是通过线程池中的空闲线程来访问服务，如果线程池已满，或者请求超时，则会进行降级处理，什么是服务降级

什么是服务降级:

**
优秀保证核心服务，非核心服务弱化或者不可用
**
用户的请求故障时，不会被阻塞，更不会无休止的等待或者看到系统崩溃，至少可以看到一个执行结果（例如返回友好的提示信息）。
服务降级虽然会导致请求失败，但是不会导致阻塞，而且最多会影响这个依赖服务对应的线程池中的资源，对其它服务没有响应。

触发Hystrix服务降级的情况

线程池已满
请求超时

服务熔断

在服务熔断中，使用的熔断器，也叫断路器，其英文单词为：Circuit Breaker
熔断机制与家里使用的电路熔断原理类似；当如果电路发生短路的时候能立刻熔断电路，避免发生灾难。在分布式系统中应用服务熔断后；服务调用方可以自己进行判断哪些服务反应慢或存在大量超时，可以针对这些服务进行主动熔断，防止整个系统被拖垮。
Hystrix的服务熔断机制，可以实现弹性容错；当服务请求情况好转之后，可以自动重连。通过断路的方式，将后续请求直接拒绝，一段时间（默认5秒）之后允许部分请求通过，如果调用成功则回到断路器关闭状态，否则继续打开，拒绝请求的服务。
Hystrix的熔断状态机模型：

在这里插入图片描述

状态机有3个状态：

Closed：关闭状态（断路器关闭），所有请求都正常访问。
Open：打开状态（断路器打开），所有请求都会被降级。Hystrix会对请求情况计数，当一定时间内失败请求百分比达到阈值，则触发熔断，断路器会完全打开。默认失败比例的阈值是50%，请求次数最少不低于20次。
Half Open：半开状态，不是永久的，断路器打开后会进入休眠时间（默认是5S）。随后断路器会自动进入半开状态。此时会释放部分请求通过，若这些请求都是健康的，则会关闭断路器，否则继续保持打开，再次进行休眠计时

服务熔断案例演示

1.模拟处理失败

为了能够精确控制请求的成功或失败，在 consumer-demo 的处理器业务方法中加入一段逻辑；使我们能控制处理失败的次数


@RestController
@RequestMapping("/consumer")
/*@DefaultProperties(defaultFallback ="queryByIdFallBack" )*/
public class ConsumerController {
    @Autowired
    private RestTemplate restTemplate;
    @Autowired(required = false)
    private DiscoveryClient discoveryClient;
    @GetMapping("/{id}")
    @HystrixCommand(defaultFallback = "queryByIdFallBack")
    public String QueryForId(@PathVariable String id){
        if (Integer.parseInt(id)==1){
            throw new RuntimeException("太忙了");
        }
        String url = "http://producer-service/user/" + id;
        return restTemplate.getForObject(url, user.class).toString();
    }
    public String queryByIdFallBack(){
        return "网络拥挤请稍后再试！！";
    }
}

这样如果参数是id为1，一定失败，其它情况都成功。

2.我们准备两个请求窗口：

一个请求：http://localhost:8080/consumer/1，注定失败
一个请求：http://localhost:8080/consumer/2，肯定成功

当我们疯狂访问id为1的请求时（超过20次），就会触发熔断。断路器会打开，一切请求都会被降级处理。此时你访问id为2的请求，会发现返回的也是失败，而且失败时间很短，只有20毫秒左右；因进入半开状态之后2是可以的。

在这里插入图片描述

不过，默认的熔断触发要求较高，休眠时间窗较短，为了测试方便，我们可以通过配置修改熔断策略：

# 配置熔断策略：
hystrix:
 command: 
  default:
   circuitBreaker:
    errorThresholdPercentage: 50 # 触发熔断错误比例阈值，默认值50%
    sleepWindowInMilliseconds: 10000 # 熔断后休眠时长，默认值5秒
    requestVolumeThreshold: 10 # 熔断触发最小请求次数，默认值是20
execution:
 isolation:
  thread:
   timeoutInMilliseconds: 2000 # 熔断超时设置，默认为1秒

**为了方便复制上述配置，可以使用如下格式复制到yml文件中会自动格式化 **
**

hystrix.command.default.circuitBreaker.requestVolumeThreshold=10
hystrix.command.default.circuitBreaker.sleepWindowInMilliseconds=10000
hystrix.command.default.circuitBreaker.errorThresholdPercentage=50
hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=2000