Hystrix-dashboard是一款针对Hystrix进行实时监控的工具,通过Hystrix Dashboard我们可以在直观地看到各Hystrix Command的请求响应时间,请求成功率等数据。但是只使用Hystrix Dashboard的话,你只能看到单个应用内的服务信息,这明显不够,我们需要一个工具能让我们汇总系统内多个服务的数据并显示到Hystrix Dashboard上,这个工具就是Turbine。关于Turbine内容请看其它文章。
Hystrix的以下配置针对的都是服务,而不是实例,比如,A服务调B服务,B服务有两个实例,假如对A的实例配置了Hystrix线程池大小为10,则表示的是A调B服务的总线程大小为10,而不是为每个B实例分配10个线程。
外部服务调A时,首先A应用会为该请求分配一个线程,假设为t1,该线程与Hystrix的线程不同,t1线程用于处理请求的全部逻辑,当需要调外部服务时,会通过Hystrix里面的线程来发起调用,此时t1相当于hystrix中线程的父线程,所以,t1中的ThreadLocal对象在Hystrix线程中无法使用。A应用本身的线程池大小默认是200(不确定是不是200)。
A应用最外层是应用自带的Tomcat容器,Tomcat接收到请求时会分配一个线程,这个线程也就是应用的线程t1,它们是同一个东西。
熔断器Hystrix
熔断器的原理很简单,如同电力过载保护器。它可以实现快速失败,如果它在一段时间内侦测到许多类似的错误,会强迫其以后的多个调用快速失败,不再访问远程服务器,从而防止应用程序不断地尝试执行可能会失败的操作,使得应用程序继续执行而不用等待修正错误,或者浪费CPU时间去等到长时间的超时产生。熔断器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。
熔断器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数,然后决定使用允许操作继续,或者立即返回错误。
熔断器开关相互转换的逻辑如下图:
Hystrix特性
1.断路器机制
断路器很好理解, 当Hystrix Command请求后端服务失败数量超过一定比例(默认50%), 断路器会切换到开路状态(Open). 这时所有请求会直接失败而不会发送到后端服务. 断路器保持在开路状态一段时间后(默认5秒), 自动切换到半开路状态(HALF-OPEN). 这时会判断下一次请求的返回情况, 如果请求成功, 断路器切回闭路状态(CLOSED), 否则重新切换到开路状态(OPEN). Hystrix的断路器就像我们家庭电路中的保险丝, 一旦后端服务不可用, 断路器会直接切断请求链, 避免发送大量无效请求影响系统吞吐量, 并且断路器有自我检测并恢复的能力.
2.服务降级Fallback
Fallback相当于是降级操作. 对于查询操作, 我们可以实现一个fallback方法, 当请求后端服务出现异常的时候, 可以使用fallback方法返回的值. fallback方法的返回值一般是设置的默认值或者来自缓存.
3.依赖隔离
在Hystrix中, 主要通过线程池来实现资源隔离. 通常在使用的时候我们会根据调用的远程服务划分出多个线程池. 例如调用产品服务的Command放入A线程池, 调用账户服务的Command放入B线程池. 这样做的主要优点是运行环境被隔离开了. 这样就算调用服务的代码存在bug或者由于其他原因导致自己所在线程池被耗尽时, 不会对系统的其他服务造成影响. 但是带来的代价就是维护多个线程池会对系统带来额外的性能开销. 如果是对性能有严格要求而且确信自己调用服务的客户端代码不会出问题的话, 可以使用Hystrix的信号模式(Semaphores)来隔离资源.
实例
代码:https://gitee.com/wudiyong/ribbonConsumer.git
因为熔断只是作用在服务调用这一端,故以ribbonConsumer项目为基础,而且,因为Feign中已经依赖了Hystrix,所以我们以Feign方式调用服务为例:
1、引入Feign+Hystrix依赖
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-feign</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix</artifactId>
</dependency>
2、开启Feign及Hystrix功能
入口类加上如下注解:
@EnableFeignClients
@EnableHystrix
也可以用feign.hystrix.enabled=true配置代替@EnableHystrix注解
3、创建调用远程服务的调用类
通常放在client包下,可以命名为RemoteServerName+Client
package com.ribbonConsumer.client;
import org.springframework.cloud.netflix.feign.FeignClient;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestMethod;
import org.springframework.web.bind.annotation.RequestParam;
import com.ribbonConsumer.client.fallback.UserInfoClientFallback;
/*
* name:被调用服务的服务名
* fallback:调用失败之后的回调类
*/
@FeignClient(name = "userInfo-service", fallback = UserInfoClientFallback.class)
public interface UserInfoClient {
/**
* userInfo-service服务中的/userInfoStr接口
* 写法与被调用的接口一样,只是没有方法体
* 注意:
* 1、如果通过@RequestParam接收参数,一定要加上(value="xxx"),否则启动报错,
* 这是因为spring-cloud-feign处理@RequestParam和Spring mvc的不一样,
* Spring mvc在@RequestParam的value为空的时候会通过反射得到参数的名字作为value
* 如果通过@RequestBody接收map或某个对象,则与普通接口一样
*/
@RequestMapping(value = "/userInfoStr", method = RequestMethod.GET)
public String userInfoStr(@RequestParam(value = "name") String name, @RequestParam(value = "age") String age);
}
4、创建调用失败的回调类
回调类是实现调用接口的一个普通类,没有任何特别,该类只有在调用失败的时候会被调用,如果请求能到达远程服务,只是远程服务返回一些错误信息,这种情况不属于调用失败,调用失败如网络不通、服务不可用情况
package com.ribbonConsumer.client.fallback;
import org.springframework.stereotype.Component;
import com.ribbonConsumer.client.UserInfoClient;
@Component
public class UserInfoClientFallback implements UserInfoClient{
@Override
public String userInfoStr(String name, String age) {
return "调用失败";
}
}
至此,Hystrix配置完成,可以开始测试了
可以在controller上加上如下代码用于测试:
@Autowired
private UserInfoClient userInfoClient;
/**
* 使用Feign方式调用服务
*/
@RequestMapping(value = "/userInfoStr", method = RequestMethod.GET)
public String userInfoStr(@RequestParam String name, @RequestParam String age){
return userInfoClient.userInfoStr(name, age);
}
可以分别测试userInfo-service服务可用和不可用两种情况
Hystrix配置
参考资料:https://blog.csdn.net/WYA1993/article/details/82352890
Hystrix可配置属性分为以下类型:
Execution:控制HystrixCommand.run() 的如何执行
Fallback: 控制HystrixCommand.getFallback() 如何执行
Circuit Breaker: 控制断路器的行为
Metrics: 捕获和HystrixCommand 和 HystrixObservableCommand 执行信息相关的配置属性
Request Context:设置请求上下文的属性
Collapser Properties:设置请求合并的属性
Thread Pool Properties:设置线程池的属性
这些配置都可以针对全局或指定服务进行设置
全局设置:hystrix.command.default.xxxx=自定义值
指定服务HystrixCommandKey设置:hystrix.command.HystrixCommandKey.xxxx=自定义值
Execution
以下属性控制HystrixCommand.run() 的如何执行
1、execution.isolation.strategy
表示HystrixCommand.run()的执行时的隔离策略,有以下两种策略
1)THREAD: “服务间调用”在单独的线程上执行,并发的请求受到线程池中线程数限制,默认为THREAD
2)SEMAPHORE: “服务间调用”在调用线程上执行,并发的请求量受信号量计数限制
在默认情况下,推荐HystrixCommands 使用 THREAD 隔离策略,HystrixObservableCommand 使用 SEMAPHORE 隔离策略。
只有在高并发(单个实例每秒达到几百个调用)的调用时,才需要修改HystrixCommands SEMAPHORE 。SEMAPHORE 隔离策略通常只用于非网络调用。
#设置所有服务的默认值
hystrix.command.default.execution.isolation.strategy=THREAD
#设置某个服务的此属性值
hystrix.command.被调用服务的服务名.execution.isolation.strategy=THREAD
2、execution.isolation.thread.timeoutMilliseconds
该属性用来配置HystrixCommand执行的超时时间,单位为毫秒。当HystrixCommand执行时间超过该配置值后,Hystrix会将该命令标记为TIMEOUT并进入服务降级处理逻辑,全局默认值为1000。
Hystrix超时时间一般会结合Ribbon超时时间一起使用,还可以配合重试配置一起使用,具体可看:
注意:Ribbon的超时时间不可大于断路器Hystrix的超时时间,虽然不会报错(会有warn级别的日志),但没有意义,因为从区间来看,Ribbon是被Hystrix包含的,如果Ribbon大于Hystrix,则Ribbon还没超时,Hystrix就已经超时了。
#设置所有服务的默认值
hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=2000
#设置服务HystrixCommandKey的此属性值
hystrix.command.HystrixCommandKey.execution.isolation.thread.timeoutInMilliseconds=2000
3、execution.timeout.enabled
该属性用来设置HystrixCommand.run()的执行是否启用超时时间。默认为true,如果设置为false,那么execution.isolation.thread.timeoutMilliseconds属性将不起作用。
#设置所有服务的默认值
hystrix.command.default.execution.timeout.enabled=true
#设置服务HystrixCommandKey的此属性值
hystrix.command.HystrixCommandKey.execution.timeout.enabled=true
4、execution.isolation.thread.interruptOnTimeout
该属性用来配置当HystrixCommand.run()执行超时的时候是否要将它中断。默认为true,和其它属性一样,也可以对全局或指定服务设置
5、execution.isolation.semaphore.maxConcurrentRequests
当HystrixCommand的隔离策略使用信号量时,该属性用来配置信号量的大小(并发请求数)。当最大并发请求数达到该设置值时,后续的请求将会被拒绝。默认值为10。
#设置所有服务的默认值
hystrix.command.default.execution.isolation.semaphore.maxConcurrentRequests=10
#设置服务HystrixCommandKey的此属性值
hystrix.command.HystrixCommandKey.execution.isolation.semaphore.maxConcurrentRequests=10
Fallback
以下属性控制HystrixCommand.getFallback() 如何执行。这些属性对隔离策略THREAD 和SEMAPHORE都起作用
1、fallback.isolation.semaphore.maxConcurrentRequests
该属性用来设置从调用线程中允许HystrixCommand.fallback()方法执行的最大并发请求数。当达到最大并发请求数时,后续的请求将会被拒绝并抛出异常(因为它已经没有后续的fallback可以被调用了)。默认为10。
2、fallback.enabled
该属性用来设置服务降级策略是否启用,如果设置为false,那么当请求失败或拒绝发生时,将不会调用HystrixCommand.getFallback()来执行服务降级逻辑。默认为true。
CircuitBreaker
这些是断路器的属性,用来控制HystrixCircuitBreaker的行为
1、circuitBreaker.enabled
是否开启断路器功能,该属性用来确定当服务请求命令失败时,是否使用断路器来跟踪其健康指标和熔断请求。默认为true。
2、circuitBreaker.requestVolumeThreshold
该属性用来设置在滚动时间窗中,断路器熔断的最小请求数。例如:默认值为20的时候,如果滚动时间窗(默认10s)内收到了19个请求,即使这19个请求都失败了,断路器也不会打开。默认值为20。
3、circuitBreaker.sleepWindowInMilliseconds
该属性用来设置当断路器打开之后的休眠时间窗。休眠时间窗结束后,会将断路器置为“半开”状态,尝试熔断的请求命令,如果依然失败就将断路器继续设置为“打开”状态,如果成功就设置为“关闭”状态。默认值为5000(单位是ms)
4、circuitBreaker.errorThresholdPercentage
该属性用来设置断路器打开的错误百分比条件。比如,默认值为50的情况下,表示在滚动时间窗中,在请求数量超过circuitBreaker.requestVolumeThreshold阈值的前提下,如果错误请求数的百分比超过50,就把断路器设置为“打开”状态,否则就设置为“关闭”状态。
5、circuitBreaker.forceOpen
如果将该属性设置为true,断路器将强制进入“打开”状态,它会拒绝所有请求。该属性优先于circuitBreaker.forceClosed属性。默认为false
6、circuitBreaker.forceClosed
如果将该属性设置为true,断路器将强制进入“关闭”状态,它会接收所有请求。默认为false
Metrics、Request Context、Collapser Properties
略
Thread Pool
设置Hystrix Commands的线程池行为,大部分情况线程数量是10。
线程池大小的计算公式如下:
最高峰时每秒的请求数量 × 99%命令执行时间 + 喘息空间
比如,每秒处理请求数为50,绝大多数请求处理时间为100ms,则线程池大小最小为5,如果预留一点空闲时间和不稳定情况,线程池大小可以设为10.
1、coreSize
设置线程池的core的大小,默认为10
#设置所有实例的默认值
hystrix.threadpool.default.coreSize=10
#设置某个实例的此属性值
hystrix.threadpool.HystrixThreadPoolKey.coreSize=20
2、maximumSize
设置最大的线程池的大小,只有设置allowMaximumSizeToDivergeFromCoreSize时,此值才起作用
#设置所有实例的默认值
hystrix.threadpool.default.maximumSize=10
#设置某个实例的此属性值
hystrix.threadpool.HystrixThreadPoolKey.maximumSize=20
3、maxQueueSize
设置最大的BlockingQueue队列的值。默认值为-1,代表使用SynchronousQueue队列,如果设置正数,则使用LinkedBlockingQueue队列
4、queueSizeRejectionThreshold
因为maxQueueSize值不能被动态修改,所有通过设置此值可以实现动态修改等待队列长度。即等待的队列的数量大于queueSizeRejectionThreshold时(但是没有达到maxQueueSize值),则开始拒绝后续的请求进入队列。如果设置-1,则属性不启作用。默认值为5。
如果设置queueSizeRejectionThreshold,则也要对maxQueueSize设置,一般来说maxQueueSize比queueSizeRejectionThreshold要大一些,拒绝阈值比队列大小要小。
参考资料:https://www.cnblogs.com/seifon/p/9921774.html
官方参考资料:https://github.com/Netflix/Hystrix/wiki/Configuration#coreSize
Hystrix Dashboard 熔断监控面板
Hystrix Dashboard及Turbine
https://www.cnblogs.com/ityouknow/p/6889059.html
http://blog.csdn.net/qq_22841811/article/details/67637781