问题描述
当使用网关代理上游服务时会出现调用方一直在等待网关的响应,最后出现上图的情况。
问题分析
流程分析
步骤号 | 描述 |
---|---|
A | client端发起请求给gateway。 |
B | gateway 处理后,将请求转发到server,并等待结果 。 |
C | server处理完请求后,返回数据给gateway。 |
D | gateway 将处理结果返回给客户端 每个阶段都会有一个预设的超时时间,由于网络、机器负载、代码异常等等各种原因,如果某个阶段没有在预期的时间内正常返回,就会导致这次请求异常,进而产生不同的状态码。 |
错误日志
分析总结
上述的问题主要出现在B C 两个阶段,一方面有可能在网关将数据转发给上游服务的时候,上游服务迟迟没有收到来自网关转发过来的请求;另一方面是上游服务已经接到来自网关的请求但是迟迟没有给网关响应导致超出了网关针对后台超时的预设时间,从而出现上述状况。
解决方案
超时问题都是后台服务响应时间超出OpenResty的timeout的设置时间,OpenResty的默认超时时间为60s。可以通过测试上游服务得出最后的影响时间的具体值,如果是固定在某个区间内的,可以通过调整OpenResty的超时时间的设置来解决此类问题:
# 连接超时
proxy_connect_timeout 具体时间s;
# 作为反向代理时,转发请求超时。
proxy_send_timeout 具体时间s;
# 获取上游响应时超时。
proxy_read_timeout 具体时间s;