一、背景
生产服务器为阿里云,应用系统出现请求第三方服务偶发性接口异常,数据查询不回来,查看日志,分析得出,请求接口超过最大连接时间30秒,正常1.2秒左右,能返回数据。经过确认,第三方https连接超时时间设置为10秒,分析认为,由于网络波动延时,导致接口请求超时,让第三方设置超时时间为30秒,重新发起请求,依然存在偶发性接口请求超时,导致数据获取异常。再次分析日志如下
第三方反馈:
我方日志:
与第三方沟通,确认对方收到请求,并及时返回。根据日志及现象,初步分析认为网络延迟导致的http丢包,于是开始抓包分析。用tcpdump在系统中抓包观察,使用wireshark分析如下:
根据图上所示分析,16-17行显示,15行,我方发出数据包,对方返回ACK后,交互时间超过最大连接时间30秒,我方发出Encrypted Alert(网上查看是没有发数据的意思),并发送FI