Spring cloud系列八 Hystrix的用处、解决的问题、工作流程图、断路器流程

标签: spring-cloud Hystrix 断路器
828人阅读 评论(0) 收藏 举报
分类:

1. 概述

本文对Hystrix进行介绍,本文内容如下:

  • 什么是Hystrix
  • Hystrix要解决的问题和产生的原因分析
  • Hystrix设计原则
  • Hystrix的处理流程图和详细流程说明
  • 断路器工作流程

2. Hystrix

2.1. 什么是Hystrix

在分布式环境中,一个服务可能会依赖很多其他的服务,并且这些服务都不可避免地有失效的可能。Hystrix通过隔离服务之间的访问点,阻止它们之间的级联故障以及提供回退选项以提高系统的整体可靠性。

2.2. Hystrix要解决的问题和产生的原因分析

Hystrix要解决的问题和必要性
避免因为单点故障导致服务级联失败,从而使得整个系统崩溃。

官方中提供一个例子,如果一个应用依赖30个服务,每个服务99.99%的时间处于正常服务状态

>
正常工作时间:99.9930 = 99.7% uptime
失败次数:0.3% of 1亿个请求 = 3,000,000 失败
每个月至少有2个小时处于异常状态

即使只有0.01%的失败率,每个月仍然有几个小时服务不可用

Hystrix问题产生的原因分析

正常请求处理流程如下
这里写图片描述

如果后端的一个服务出现延迟,则会阻塞整个请求
这里写图片描述

对于高并发的系统,即使只有一个后端的服务出现延迟,它也会导致整个系统的资源在几秒内被全部消耗掉。更糟糕的是,这些服务有可能被其他服务依赖,由于每个服务都有队列、线程池、其他系统资源等,一旦某个服务失效或者延迟增高,会导致整个系统发生更多的级联故障,从而导致这个分布式系统都不可用
这里写图片描述

2.3. Hystrix设计原则

  • 防止单个服务的故障,耗尽整个系统服务的容器(比如tomcat)的线程资源,避免分布式环境里大量级联失败。通过第三方客户端访问(通常是通过网络)依赖服务出现失败、拒绝、超时或短路时执行回退逻辑
  • 用快速失败代替排队(每个依赖服务维护一个小的线程池或信号量,当线程池满或信号量满,会立即拒绝服务而不会排队等待)和优雅的服务降级;当依赖服务失效后又恢复正常,快速恢复
  • 提供接近实时的监控和警报,从而能够快速发现故障和修复。监控信息包括请求成功,失败(客户端抛出的异常),超时和线程拒绝。如果访问依赖服务的错误百分比超过阈值,断路器会跳闸,此时服务会在一段时间内停止对特定服务的所有请求
  • 将所有请求外部系统(或请求依赖服务)封装到HystrixCommand或HystrixObservableCommand对象中,然后这些请求在一个独立的线程中执行。使用隔离技术来限制任何一个依赖的失败对系统的影响。每个依赖服务维护一个小的线程池(或信号量),当线程池满或信号量满,会立即拒绝服务而不会排队等待

2.4. Hystrix处理后新的流程

当您使用Hystrix包装每个基础依赖关系时,新的图如下。每个依赖都是相互隔离的,当延迟发生时,会快速失败,执行回退逻辑,避免消耗掉所有资源

这里写图片描述

3. Hystrix的处理流程图和详细流程说明

这里写图片描述

Hystrix的处理流程
1. 构造HystrixCommand或HystrixObservableCommand对象
创建代码如下
HystrixCommand command = new HystrixCommand(arg1, arg2);
HystrixObservableCommand command = new HystrixObservableCommand(arg1, arg2);

2. 执行Command 命令

共有4种执行命令的方法,前2种只支持HystrixCommand ,后2种只支持HystrixObservableCommand

  • execute(): 同步阻塞直至从依赖服务返回结果或抛出异常
  • queue(): 异步模式,返回Future,Future封装返回的内容
  • observe() : 直接订阅Observable ,此对象包含了从依赖服务返回的结果
  • toObservable() : 返回Observable 对象,当你订阅他时,它会执行Hystrix命令并返回结果

HystrixCommand.execute(): 实际调用queue()的方法

public R execute() {
   return queue().get();
}

HystrixCommand.queue(): 实际调用toObservable()的方法

 public Future<R> queue() {
final Future<R> delegate = toObservable().toBlocking().toFuture();
....
}

HystrixObservableCommand.observe():实际调用toObservable()的方法

public Observable<R> observe() {
....
    final Subscription sourceSubscription = toObservable().subscribe(subject);
....

通过以上的代码,我们可以知道:第1种是同步阻塞性调用,第2种是异步非阻塞性调用,第3、4种是基于发布-订阅响应式的调用。虽然是4种调用方式,其实际最后都是基于toObservable方法来实现的

3. 判断结束是否有缓存
如果请求缓存功能开启,并且请求在缓存命中,那么返回一个Observable,此对象包含请求的结束

4. 判断短路器是否开启
在执行命令时,Hystrix 如果发现断路器跳闸,那么hystix会跳到步骤8去执行回退(fallback)逻辑。如果断路器没有跳闸,则继续执行步骤5

关于断路器打开和关闭的条件见本文的下方。

5. 判断线程池/队列/信号资源是否满了
如果命令关联的线程池和队列(或信号量)满了,则不会执行命令,会跳到步骤8去执行回退(fallback)逻辑

6. 执行HystrixObservableCommand.construct()或HystrixCommand.run()

执行HystrixCommand.run()或HystrixObservableCommand.construct()时,如果执行超时或者执行失败,则执行会跳到步骤8去执行回退(fallback)逻辑;如果正常结束,Hystrix 会记录一些日志和监控数据,并返回处理结果

7. Calculate Circuit Health
Hystrix向断路器报告成功、失败、拒绝和超时。断路器维护一组计数器来统计执行数据。

8. 获取 Fallback逻辑
当发生如下情况时,Hystrix会尝试执行回退(fallback)逻辑:

  • 在执行时construct() or run() ,跑出异常 (发生在步骤6.)
  • 断路器打开时,命令被断路 (发生在步骤4.)
  • 当执行命令时,依赖的线程池、队列或信号量满(发生在步骤5.)
  • 执行命令超时

编写回退(fallback)逻辑时,这个逻辑里最好没有网络调用,只从内存中获取或者只有静态的逻辑,这个逻辑保证不会执行失败。如果非要通过网络去获取Fallback,你需要在使用其他HystrixCommand或HystrixObservableCommand封装请求,并且这个请求必须有fallback逻辑且值没有网络调用,只有静态逻辑

9. Return the Successful Response
返回执行结束或者Observable

4. 断路器工作流程

下图显示HystrixCommand或HystrixObservableCommand如何与HystrixCircuitBreaker及其逻辑和决策流程交互,包括计数器在断路器中的行为。

这里写图片描述
断路器开启关闭的规则如下:

  • 如果服务请求数量达到一定阈值(HystrixCommandProperties.circuitBreakerRequestVolumeThreshold)且如果服务请求失败的百分比超过阈值(HystrixCommandProperties.circuitBreakerErrorThresholdPercentage())…
  • 然后断路器的状态从CLOSED改变为OPEN.
  • 当断路器open时,它会短路所有经过此断路器的请求。
  • 经过一段时间(HystrixCommandProperties.circuitBreakerSleepWindowInMilliseconds()),接下来的第一个请求允许通过(此时断路器是处于HALF-OPEN状态)。 如果请求失败,断路器将在睡眠窗口持续时间内返回到OPEN状态。 如果请求成功,断路器状态将转换到CLOSED,又会转到逻辑1。

5. 其他

本文使用的图都来自Hystrix官网的wiki

查看评论

降级特技之使用Hystrix实现降级和熔断—《亿级流量网站架构核心技术》

使用Hystrix实现降级   通过配置中心可以人工进行降级,而我们也需要根据服务的超时时间进行自动降级,本部分将演示使用Hystrix实现超时自动降级。Hystrix介绍请参考“第3章 隔离术”中...
  • jek123456
  • jek123456
  • 2017-04-18 09:27:12
  • 1755

防雪崩利器:熔断器 Hystrix 的原理与使用

前言 分布式系统中经常会出现某个基础服务不可用造成整个系统不可用的情况, 这种现象被称为服务雪崩效应. 为了应对服务雪崩, 一种常见的做法是手动服务降级. 而Hystrix的出现,给我们提供了另...
  • varyall
  • varyall
  • 2018-01-04 22:43:32
  • 29

Spring Cloud构建微服务架构-Hystrix服务降级

在微服务架构中,我们将系统拆分成了一个个的服务单元,各单元应用间通过服务注册与订阅的方式互相依赖。由于每个单元都在不同的进程中运行,依赖通过远程调用的方式执行,这样就有可能因为网络原因或是依赖服务自身...
  • qq_40354025
  • qq_40354025
  • 2017-11-27 09:10:40
  • 254

Spring cloud入门

spring cloud生态spring cloud 为开发人员提供了快速构建分布式系统的一些工具,包括配置管理、服务发现、断路器、路由、事件总线等等 服务的注册与发现(Eureka)...
  • zlfing
  • zlfing
  • 2017-07-13 14:31:11
  • 747

SpringCloud Hystrix 断路器

雪崩效应在微服务架构中通常会有多个服务层调用,大量的微服务通过网络进行通信,从而支撑起整个系统。各个微服务之间也难免存在大量的依赖关系。然而任何服务都不是100%可用的,网络往往也是脆弱的,所以难免有...
  • w_x_z_
  • w_x_z_
  • 2016-12-03 14:09:30
  • 4042

spring cloud-hystrix

spring cloud-hystrix
  • quwenzhe
  • quwenzhe
  • 2017-05-03 15:52:50
  • 2276

spring cloud: Hystrix断路器(熔断器)

1.Hystrix客户端Netflix已经创建了一个名为Hystrix的库,实现了断路器的模式。在microservice架构通常有多个层的服务调用。 低水平的服务的服务失败会导致级联故障一直给到用...
  • zhuchuangang
  • zhuchuangang
  • 2016-05-01 10:06:31
  • 25222

Spring Cloud Hystrix--熔断器

一、Hystrix 熔断器 1、引入pom org.springframework.boot spring-boot-starter-parent 1.3.5.RELEASE ...
  • Daybreak1209
  • Daybreak1209
  • 2016-12-13 16:39:19
  • 3073

服务熔断、降级、限流、异步RPC -- HyStrix

在今天,基于SOA的架构已经大行其道。伴随着架构的SOA化,相关联的服务熔断、降级、限流等思想,也在各种技术讲座中频繁出现。本文将结合Netflix开源的Hystrix框架,对这些思想做一个梳理。背景...
  • chunlongyu
  • chunlongyu
  • 2016-11-21 14:14:51
  • 14646

Hystrix学习笔记一

在分布式系统中,通常一个系统会依赖很多个系统,如何保证自身系统不受依赖的系统的影响,导致连锁反应全面崩溃是一个重要的技术难题。所幸 Netflix 开源的 Hystrix框架 帮我们大大简化了超时机...
  • marsflow
  • marsflow
  • 2016-06-07 16:42:45
  • 2739
    个人资料
    专栏达人 持之以恒
    等级:
    访问量: 15万+
    积分: 2248
    排名: 2万+
    博客专栏
    最新评论