Hystrix是什么
分布式系统面临的问题
复杂分布式体系结构中的应用程序有数十个依赖关系,每个依赖关系在某些时候(异常故障)将不可避免出现损失的情况。
服务雪崩
分布式系统环境下,通常会有很多层的服务调用。由于网络原因或自身的原因,服务一般无法保证 100% 可用。如果一个服务出现了问题,调用这个服务就会出现线程阻塞的情况,此时若有大量的请求涌入,就会出现多条线程阻塞等待,进而导致服务瘫痪。
多个微服务之间调用的时候,假设微服务 A 调用微服务 B 和微服务 C, 微服务 B 和微服务 C 又调用其它的微服务,这就是所谓的 “扇出”。如果扇出的链路上某个微服务的调用响应时间过长或者不可用,对微服务 A 的调用就会占用越来越多的系统资源,进而引起系统崩溃,就是服务故障的 “雪崩效应”.
**对于高流量的应用来说,单一的后端依赖可能会导致所有服务器上的所有资源都在几秒钟内饱和。**比失败更糟糕的是,这些应用程序还可能导致服务之间的延迟增加,备份队列,线程和其他系统资源紧张,导致整个系统发生更多的级联故障。这些都表示需要对故障和延迟进行隔离和管理,以便单个依赖关系的失败,不能取消整个应用程序或系统。
所以,通常当你发现一个模块下的某个实例失败后,这时候这个模块依然还会接收流量,然后这个有问题的模块还调用了其他的模块,这样就会发生级联故障,或者叫雪崩。
要防止雪崩的扩散,我们就要做好服务的容错:保护自己不被猪队友拖垮的一些措施。
常见的容错方案:隔离、超时、限流、熔断、降级
Hystrix
Hystrix 是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时、异常等。
Hystrix 能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。
“断路器” 本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的故障监控 (类似熔断保险丝),向调用方返回一个符合预期的、可处理的备选响应 (FallBack) ,而不是长时间的等待或者抛出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间、不必要地占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。
目前:Hystrix 已经停更,后面会使用阿里的 sentinel,但是 Hystrix 仍然有值得学习的思想和设计。
Hystrix停更进维
https://github.com/NetFlix/Hystrix/wiki/How-To-Use
Hystrix is no longer in active development, and is currently in maintenance mode.
https://github.com/NetFlix/Hystrix
Hystrix的服务降级熔断限流概念初步认识
服务降级
服务器忙,请稍后再试,不让客户端等待并立刻返回一个友好提示,fallback
发生服务降级的情况:
- 程序运行异常
- 超时
- 服务熔断出发服务降级
- 线程池 / 信号量打满也会导致服务降级
服务熔断
类比保险丝,达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示。
服务降级 -> 进而熔断 -> 恢复调用链路
服务限流
秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟N个,有序进行
Hystrix支付微服务构建
1、建module
cloud-provider-hystrix-payment8001
2、改pom
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<parent>
<artifactId>cloud2020</artifactId>
<groupId>demo.yangxu.springcloud</groupId>
<version>1.0-SNAPSHOT</version>
</parent>
<modelVersion>4.0.0</modelVersion>
<artifactId>cloud-provider-hystrix-payment8001</artifactId>
<dependencies>
<!--hystrix-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<!--eureka client-->
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-eureka-client</artifactId>
</dependency>
<!--web-->
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-actuator</artifactId>
</dependency>
<dependency><!-- 引入自己定义的api通用包,可以使用Payment支付Entity -->
<groupId>demo.yangxu.springcloud</groupId>
<artifactId>cloud-api-commons</artifactId>
<version>1.0-SNAPSHOT</version>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-devtools</artifactId>
<scope>runtime</scope>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
<optional>true</optional>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
</dependencies>
</project>
3、写yml
server:
port: 8001
spring:
application:
name: cloud-provider-hystrix-payment
eureka:
client:
register-with-eureka: true
fetch-registry: true
service-url:
#defaultZone: http://eureka7001.com:7001/eureka,http://eureka7002.com:7002/eureka
defaultZone: http://eureka7001.com:7001/eureka
4、主启动
demo.yangxu.springcloud.PaymentHystrixMain8001
package demo.yangxu.springcloud;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.netflix.eureka.EnableEurekaClient;
@SpringBootApplication
@EnableEurekaClient
public class PaymentHystrixMain8001 {
public static void main(String[] args) {
SpringApplication.run(PaymentHystrixMain8001.class, args);
}
}
5、业务类
Service
demo.yangxu.springcloud.service.PaymentService
package demo.yangxu.springcloud.service;
import org.springframework.stereotype.Service;
import java.util.concurrent.TimeUnit;
@Service
public class PaymentService {
/**
* 正常访问,肯定OK
* @param id
* @return
*/
public String paymentInfo_OK(Integer id)
{
return "线程池: "+Thread.currentThread().getName()+" paymentInfo_OK,id: "+id+"\t"+"O(∩_∩)O哈哈~";
}
public String paymentInfo_TimeOut(Integer id)
{
int timeNumber = 3;
try {
TimeUnit.SECONDS.sleep(timeNumber); } catch (InterruptedException e) {
e.printStackTrace(); }
return "线程池: "+Thread.currentThread().getName()+" paymentInfo_TimeOut,id: "+id+"\t"+"O(∩_∩)O哈哈~"+" 耗时(秒): "+timeNumber;
}
}
Controller
demo.yangxu.springcloud.controller.PaymentController
package demo.yangxu.springcloud.controller;
import demo.yangxu.springcloud.service.PaymentService;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.RestController;
import javax.annotation.Resource;
@RestController
@Slf4j
public class PaymentController {
@Resource
private PaymentService paymentService;
@Value("${server.port}")
private String severPort;
@GetMapping(value = "/payment/hystrix/ok/{id}")
public String paymentInfo_OK(@PathVariable("id") Integer id){
String result = paymentService.paymentInfo_OK(id);
log.info("*****result: "+result);
return result;
}
@GetMapping(value = "/payment/hystrix/timeout/{id}")
public String paymentInfo_TimeOut(@PathVariable("id") Integer id){
String result = paymentService.paymentInfo_TimeOut(id);
log.info("*****result: "+result);
return result;
}
}
6、正常测试
启动eureka7001
启动cloud-provider-hystrix-payment8001
访问
success的方法
http://localhost:8001/payment/hystrix/ok/31
线程池: http-nio-8001-exec-10 paymentInfo_OK,id: 31 O(∩_∩)O哈哈~
每次调用耗费3秒
http://localhost:8001/payment/hystrix/timeout/31
线程池: http-nio-8001-exec-7 paymentInfo_TimeOut,id: 31 O(∩_∩)O哈哈~ 耗时(秒): 3
上述module均ok
以上述为根基平台,从正确 -> 错误 -> 降级熔断 -> 恢复
JMeter高并发压测后卡顿
JMeter 工具下载地址:
http://jmeter.apache.org/download_jmeter.cgi
JMeter 工具历史版本下载地址:
https://archive.apache.org/dist/jmeter/binaries/
下载解压后,进入 bin 目录,双击 jmeter.bat 即可启动。
将JMeter 修改为中文版:
在apache-jmeter-2.13\bin\jmeter.properties文件中添加以下内容:
language=zh_CN
进行压力测试:
1、测试计划->添加->Threads(Users)->线程组
2、线程数200,1秒钟1个,循环100次,共200*100=20000个并发
3、保存
4、线程组20200726->添加->Sampler->HTTP请求
5、填写以下信息
6、保存,启动
7、查看效果
此时 2 万个线程访问的是 http://localhost:8001/payment/hystrix/timeout/31
但是此时访问 http://localhost:8001/payment/hystrix/ok/31
会发现不能立即加载出来,有一定的延迟。
因为大家都是同一个微服务,此时 timeout 压力大,服务器集中去处理这 2 万个线程了,所以导致 ok 这边被拖累。tomcat的默认工作线程被打满了,没有多余的线程来分解压力和处理。
订单微服务调用支付服务出现卡顿
1、建module
cloud-consumer-feign-hystrix-order80
2、改pom
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<parent>
<artifactId>cloud2020</artifactId>
<groupId>demo.yangxu.springcloud</groupId>
<version>1.0-SNAPSHOT</version>
</parent>
<modelVersion>4.0.0</modelVersion>
<artifactId>cloud-consumer-feign-hystrix-order80</artifactId>
<dependencies>
<!--openfeign-->
<dependency>