Spring Cloud Ribbon 重试机制

最新推荐文章于 2025-03-28 14:51:42 发布

原创最新推荐文章于 2025-03-28 14:51:42 发布 · 3.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#spring #java

spring cloud 专栏收录该内容

65 篇文章

订阅专栏

在集群环境中，当服务节点故障时，Spring Cloud Ribbon的默认轮询策略可能导致请求转发到故障节点。本文讨论了如何在Zuul中配置Ribbon的重试机制，以实现类似Nginx的请求保障，确保请求的成功。通过引入Spring Retry并配置`zuul.retryable=true`，可以在服务下线时避免请求失败。同时提供了测试步骤和相关代码参考。

##前言
在集群环境中，多个节点来提供服务，难免会有某个节点故障

用Nginx做负载均衡的时候，如果你的应用是无状态的，是可以滚动发布的，也就是一台台去重启应用

这样对用户其实是影响比较小的，因为Nginx在转发请求失败后会重新将该请求转发到别的实例上去

##Zuul中是否也存在这样的问题
我们在用Zuul构建API网关时，发现eureka中的服务挂了一个, 由于ribbon的默认负载机制是轮询

如果一个服务下线，eureka并不会马上清除信息，不像zookeeper那样基于watcher可以实时监控下线

所以在eureka中挂掉的服务没有被清空信息时，zuul会转发到已经故障的机器，导致请求失败

当然这个不会持续很久，当连续失败hystrix就会处于打开状态，就算有一次失败，我觉得也是不能容忍的

所以我们需要有像Nginx中那样重试的机制来保证请求的成功，哪怕延迟个几百毫秒响应给使用方

在Zuul中我们可以配置ribbon的重试机制来实现，必须依赖一个 Spring Retry

官方文档地址：http://cloud.spring.io/spring-cloud-static/Dalston.SR4/multi/multi_netflix-metrics.html

具体配置如下:
##pom.xml

<!-- 重试机制 ，必须配，否则重试不生效 -->
<dependency>
	<groupId>org.springframework.retry</groupId>
	<artifactId>spring-retry</artifactId>
</dependency>

##application.properties

# hystrix的超时时间必须大于ribbon的超时时间
hystrix.command.default.execution.isolation.thread.timeoutInMilliseconds=10000
# 开启重试
zuul.retryable=true
spring.cloud.loadbalancer.retry.enabled=true
# 请求连接的超时时间
ribbon.connectTimeout=2000
# 请求处理的超时时间
ribbon.readTimeout=5000
# 对当前实例的重试次数
ribbon.maxAutoRetries=1
# 切换实例的重试次数
ribbon.maxAutoRetriesNextServer=3
# 对所有操作请求都进行重试
ribbon.okToRetryOnAllOperations=true