请求失败，应该重试吗？不应该吗？

最新推荐文章于 2023-10-11 11:33:49 发布

空无c

最新推荐文章于 2023-10-11 11:33:49 发布

阅读量671

点赞数 2

分类专栏： java http 文章标签： java 网络

本文链接：https://blog.csdn.net/qq826654664jx/article/details/116108221

版权

先点赞再看，养成好习惯

前言

在网络请求中，由于网络是不可靠的，所以经常会有请求失败的场景。针对这种问题，通常的做法是增加重试机制，在请求失败后重新请求，尽量保证请求的成功，从而提高服务的稳定性。

重试的风险

可是大多数人不愿意轻易的重试，因为往往重试会带来更大的风险。比如过多的重试，会给被调用服务造成更大的压力，放大原有的问题。

如下图所示，服务 A 调用服务 B，服务 B 根据请求数据不同，会调用服务 C 和服务 D。此时服务 C 出现故障，不可用了，那么服务 B 中所有对服务 C 的请求都会超时，但服务 D 现在还是可用的；可由于服务 A 中大量的重试导致服务 B 的负载快速升高，很快的将服务 B 的负载打满（比如连接池沾满）。现在调用服务 D 的分支请求也不可用了，因为服务 B 已经被重试请求打满，无法再处理任何请求了。
request_retry (6).png
如果服务自身是可用的，但网络出现较大的延迟、抖动或者丢包，导致请求到达目标服务或返回发起服务超时；此时如果客户端发起重试，那么对于接收端来说，很可能会收到多个相同的请求。所以服务端还需要增加幂等的处理，保证多次请求下结果一致

既然重试有风险，那难道就不应该重试吗？失败就直接失败，啥都不管吗？

不同时机下的失败重试

是否进行重试，这个需要区分当前失败的原因，不能简单粗暴的决定重试或者不重试。网络很复杂，链路很长，不同类型的协议，决定是否重试的策略也有所不同。

HTTP 协议下的重试

一个基本的 HTTP 请求，会包含以下几个阶段：

DNS 解析
TCP 三次握手
发送&接受对端数据

在 DNS 解析阶段时，如果域名不存在，或者域名没有 DNS 记录，根据域名无法解析到对应的主机地址列表，那么根本就无法发起请求，此时重试没有任何意义，所以并不需要重试

在 TCP 握手阶段，如果目标服务不可用，那么此时重试也没有什么意义，因为在请求的第一步- 握手都不成功，大概率这个 host 是不可用的。

挺过了 DNS 和握手两个阶段之后，终于到了收发数据的阶段。到了这一步一旦出现失败，是否重试要考虑的因素可就更多了。

如下图所示的这种情况中，因为网络拥塞等原因，导致数据到达服务端时间过长，但最终服务端也收到了完整的报文，已经开始处理请求，可此时客户端因为超时放弃了该请求，那么如果客户端此时新建一条 TCP 连接发起重试，那么对于服务端来说就会收到两次相同的请求报文，处理两次该请求，可能造成严重的后果

所以这种已经发送成功的情况，就不适合重试
request_timeout_write (2).png
问题来了，怎么样才能知道我发送成功了呢？socket.write没有报错就算成功了？SocketChannel.write之后，Buffer 写空了就算成功了？

并没有那么简单，应用层的 socket write，只是将数据写入 SND Buffer 中，至于 SND Buffer 中的数据什么时候被操作系统发送至网络，这个并没有任何保证。阻塞和非阻塞也只是针对 socket.write 这个操作的，当 SND Buffer已满，无法将数据写入内核 SND Buffer 时，就会发生阻塞。

但我们可以粗略的认为，socket.write 成功并且应用层 buffer 被写空，就是已经发送成功了。

现在看看另一种情况，当数据发送时对端就直接关闭了socket，返回 rst 标识：

request_rst_write (2).png
那么这种情况，就很适合进行重试。因为对于服务端来说，并没有开始处理这个请求，所以重试（重建连接重发请求）只会提高可用性，并不会造成什么负担

HTTP 协议中，对 Request Method 还有一些语义上的约定：

GET	POST	PUT	DELET
列出URI，以及该资源组中每个资源的详细信息（后者可选）。	在本组资源中创建/追加一个新的资源。该操作往往返回新资源的URL。	使用给定的一组资源替换当前整组资源。	删除整组资源。
安全（更是幂等）	非幂等	幂等	幂等

PUT/DELETE 是幂等操作，所以就算处理相同报文的请求也不会有数据重复之类的问题。但 POST 可不是，POST 的语义是创建/添加，这是一个非幂等的请求类型。

现在回到上面重试的问题，如果请求报文已经发送成功，但响应超时，但由请求的 API Method 是一个DELETE 类型，这种情况就可以考虑重试，因为 DELETE 语义上是幂等的；GET/PUT 同理，语义上幂等的就可以考虑重试。

但 POST 可不行，因为语义上是非幂等的，重试很可能造成重复的处理请求

可是……一切真的那么美好吗？能严格准守语义的 API 能有几家？所以单靠语义上的约定，非常不稳妥，一定要足够了解服务端的接口是否支持幂等，才可以考虑重试问题。

HTTPS 下的重试

HTTPS 面世这么多年，终于在近几年完全普及了，没升级的网站在浏览器中都会提示不安全，目前能暴露在公网的 Web API 也基本都是上 HTTPS 的。

在 HTTPS 中，重试的策略又会有一些变化：

上图是HTTPS 握手的流程，在 TCP 建立连接之后，会先进行 SSL 的握手，验证对端证书，生成临时对称密钥之列的操作。

如果在 SSL 握手阶段就发生失败，比如证书到期，证书不受信等问题，那么也是完全不需要重试的。因为这种问题不会是短暂的，一旦出现就是长时间失败，重试也是失败。

主流网络库 & RPC 框架中的重试机制

介绍完了 HTTP(S) 协议下对重试的考虑，现在来看看主流网络库对重试的处理方式，看看这种主流开源项目中的处理机制够不够“合理”

Apache HttpClient 的重试机制（v4.x）

Apache HttpClient 是 Java 里最主流的一个 HTTP 工具库了（后端方向），虽然 JDK 也提供了基本的 HTTP SDK，但……太基础了，没法直接使用。而 Apache HttpClient（简称Apache HC）弥补了这个不足，提供了一套超级强大的 HTTP SDK，功能强大、使用简单、所有组件都可以定制。

Apache HC 默认的重试策略类在org.apache.http.impl.client.DefaultHttpRequestRetryHandler，先来看看实现（省略了一些不重要的代码）：

//返回true，代表需要重试，false不重试
@Override
public boolean retryRequest(
    final IOException exception

最低0.47元/天解锁文章

空无c

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
请求失败，应该重试吗？不应该吗？

theme: smartblue先点赞再看，养成好习惯前言在网络请求中，由于网络是不可靠的，所以经常会有请求失败的场景。针对这种问题，通常的做法是增加重试机制，在请求失败后重新请求，尽量保证请求的成功，从而提高服务的稳定性。重试的风险可是大多数人不愿意轻易的重试，因为往往重试会带来更大的风险。比如过多的重试，会给被调用服务造成更大的压力，放大原有的问题。如下图所示，服务 A 调用服务 B，服务 B 根据请求数据不同，会调用服务 C 和服务 D。此时服务 C 出现故障，不可用了，那么服.
复制链接

扫一扫

专栏目录