一、概念介绍。
- Ribbon:负载均衡,是针对服务的多实例负载均衡的配置,负责对 eureka 中的服务进行调用。
- Hystrix:熔断器,当调用 zuul网关 具体业务的时候可能受到网络,代码执行时间等影响长时间无响应,这个时候就需要配置hystrix,避免线程长时间占用内存,造成内存泄露,服务挂掉等。负责当 ribbon 出现问题时保证整个服务的畅通。
二、Ribbon 配置。
-
当使用了 Eureka 注册中心,zuul.routes 路由方式走 serviceId 的时候,通过 ribbon.ReadTimeout 和 ribbon.ConnectTimeout 配置。(也就是说,zuul 路由方式不同,生效的配置是不同的)
ribbon:
ReadTimeout:10000 # 建立连接后,请求处理的超时时间
ConnectTimeout:5000 # 建立连接的超时时间
MaxAutoRetries:1 # 当前实例的重试次数
MaxAutoRetriesNextServer:1 # 切换实例的重试次数
- 当 zuul.routes 路由走 url 的时候,通过 zuul.host.connect-timeout-millis 和 zuul.host.socket-timeout-millis 配置。(也就是说,zuul 路由方式不同,生效的配置是不同的)
zuul:
host:
connect-timeout-millis: 30000
socket-timeout-millis: 30000
- 如果想要对指定服务进行特殊配置,配置方式如下:
<serviceId>:
ribbon:
ReadTimeout:10000 # 建立连接后,请求处理的超时时间
ConnectTimeout:5000 # 建立连接的超时时间
MaxAutoRetries:1 # 当前实例的重试次数
MaxAutoRetriesNextServer:1 # 切换实例的重试次数
OkToRetryOnAllOperations: true # 都所有操作请求都进行重试
说明:
(1)serviceId 为服务名。
(2)具体说明可查阅 官网
三、Hytrix 配置。
- 如果 zuul 配置了熔断 fallback 的话,熔断超时也要配置。配置属性如下:
hystrix:
command:
default:
execution:
isolation:
thread:
timeoutInMilliseconds: 90000 # 熔断服务请求超时时间
说明:
(1)default代表默认配置。
- 如果你想为某个特定的 serviceId 配熔断超时策略,配置方式如下:
hystrix:
command:
<serviceId>:
execution:
isolation:
thread:
timeoutInMilliseconds: 60000
说明:
(1)serviceId 为服务名。
四、完整示例。
ribbon:
ReadTimeout: 30000
ConnectTimeout: 30000
hystrix:
command:
default:
execution:
isolation:
thread:
timeoutInMilliseconds: 60000 # 熔断服务请求超时时间
四、遇到的问题。
1、WARN o.s.c.n.z.f.r.s.AbstractRibbonCommand.getHystrixTimeout 115 - The Hystrix timeout of 60000ms for the command igg-aggregate-server is set lower than the combination of the Ribbon read and connect timeout, 120000ms.
原因:如果 hystrixTimeout 小于 ribbonTimeout,可能在 Ribbon 切换实例进行重试的过程中就会触发熔断。否则 hystrix 熔断了以后,ribbon 的重试就都没有意义了。
那么,为什么 ribbonTimeout 超时时长是 120s 呢?可以查看源码 AbstractRibbonCommand.class
protected static int getHystrixTimeout(IClientConfig config, String commandKey) {
int ribbonTimeout = getRibbonTimeout(config, commandKey);
DynamicPropertyFactory dynamicPropertyFactory = DynamicPropertyFactory.getInstance();
// 获取默认的hytrix超时时间
int defaultHystrixTimeout = dynamicPropertyFactory.getIntProperty("hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds",
0).get();
// 获取具体服务的hytrix超时时间,这里应该是hystrix.command.foo.execution.isolation.thread.timeoutInMilliseconds
int commandHystrixTimeout = dynamicPropertyFactory.getIntProperty("hystrix.command." + commandKey + ".execution.isolation.thread.timeoutInMilliseconds",
0).get();
int hystrixTimeout;
// hystrixTimeout的优先级是 具体服务的hytrix超时时间 > 默认的hytrix超时时间 > ribbon超时时间
if(commandHystrixTimeout > 0) {
hystrixTimeout = commandHystrixTimeout;
}
else if(defaultHystrixTimeout > 0) {
hystrixTimeout = defaultHystrixTimeout;
} else {
hystrixTimeout = ribbonTimeout;
}
// 如果默认的或者具体服务的hytrix超时时间小于ribbon超时时间就会警告
if(hystrixTimeout < ribbonTimeout) {
LOGGER.warn("The Hystrix timeout of " + hystrixTimeout + "ms for the command " + commandKey +
" is set lower than the combination of the Ribbon read and connect timeout, " + ribbonTimeout + "ms.");
}
return hystrixTimeout;
}
protected static int getRibbonTimeout(IClientConfig config, String commandKey) {
int ribbonTimeout;
// 默认为 2s
if (config == null) {
ribbonTimeout = 2000;
} else {
// 这里获取了四个参数,ReadTimeout,ConnectTimeout,MaxAutoRetries, MaxAutoRetriesNextServer,优先级:具体服务 > 默认
// 1. 请求处理的超时时间,默认 1s
int ribbonReadTimeout = getTimeout(config, commandKey, "ReadTimeout", Keys.ReadTimeout, 1000);
// 2. 请求连接的超时时间,默认 1s
int ribbonConnectTimeout = getTimeout(config, commandKey, "ConnectTimeout", Keys.ConnectTimeout, 1000);
// 3. 对当前实例的重试次数.默认 0
int maxAutoRetries = getTimeout(config, commandKey, "MaxAutoRetries", Keys.MaxAutoRetries, 0);
// 4. 切换实例的重试次数,默认 1
int maxAutoRetriesNextServer = getTimeout(config, commandKey, "MaxAutoRetriesNextServer", Keys.MaxAutoRetriesNextServer, 1);
// ribbonTimeout的计算方法
ribbonTimeout = (ribbonReadTimeout + ribbonConnectTimeout) * (maxAutoRetries + 1) * (maxAutoRetriesNextServer + 1);
}
return ribbonTimeout;
}
也就说,ribbonTimeout 的计算方法为:
ribbonTimeout = (ribbonReadTimeout + ribbonConnectTimeout) * (maxAutoRetries + 1) * (maxAutoRetriesNextServer + 1);
即:
ribbonTimeout = (30000 + 30000) * (0 + 1) * (1 + 1) = 120000
解决:修改超时时间。
ribbon:
ReadTimeout: 30000
ConnectTimeout: 15000
hystrix:
command:
default:
execution:
isolation:
thread:
timeoutInMilliseconds: 90000 # 熔断服务请求超时时间
【一起学习】