最近在项目中遇到一个特殊情况,某个客户通过HTTPS访问公司的公网服务,有较大概率出现响应超时的问题。
经过排查定位,确认以下信息:
1、客服服务器访问其他公司服务,均没有出现大概率的超时问题。
2、公司服务,压力测试正常,且没有其他客户反馈此类问题。
3、客户公网出口,三大运营商各有一条。
根据以上信息,初步定位是运营商网络,到公司阿里云服务期间的路由问题。以下是检测过程:
1、执行traceroute进行路由追踪,确认出口是移动运营商,但还无法确认具体问题。
2、使用mtr命令,发现请求报文在区域运营商网络转发到阿里云服务器期间,丢包严重。
解决方案:因为阿里云服务器部署在杭州地区,为解区域运营商路由问题,在西南区重新购买服务器进行部署,问题解决。