最近时运不佳,几乎天天被线上问题骚扰。前几天刚解决了一个HashSet的并发问题,周六又来了一个性能问题。
大致的现象是:
我们提供出去的一个OpenAPI反应时快时慢,快的时候几十毫秒,慢的时候几秒钟才响应。
一、尝试解决
由于这种不是业务问题,不能直接定位。所以尝试在测试环境复现,但遗憾的是测试环境贼快。
没办法,只能硬着头皮上了。
中途有抱着侥幸心里让运维查看了Nginx里OpenAPI的响应时间,想把锅扔给网络。结果果然打脸了:Nginx里的日志表明响应时间确实有问题。
为了清晰的了解这个问题,我简单梳理了一下调用过程:
整个的流程算是比较常见的分层架构:
客户端请求到Nginx;
Nginx负载了后端的web服务;
web服务通过RPC调用后端的Service服务。
<