## 记录一次生产环境接口超时排查问题
背景:今天上班搬砖时,用户反馈某个工厂的一个功能接口报错。
处理流程如下:
1、首先去kibana平台查看报错日志,日志显示接口调用超时。看到报错后首先去看了程序代码,最近没有人动过,因此排除业务代码的问题。
2、由于是超时原因,所以去跟程序看了执行的sql,发现都是毫秒级别的sql,也排除慢sql原因
3、由于是武汉的工厂反馈的问题,其他地区的工厂没有反馈异常(我们的系统是分布式),因此联想到了网络原因。跟武汉的网络工程师沟通后,发现网络是通的,所以我去看了应用的访问时间限制
配置如下:
client:
config:
default:
connectTimeout: 5_000
readTimeout: 5_000
发现仅配置了5秒之后,感觉大概率是这个原因(武汉工厂的网络到中心服务本来就比较慢),改大时间进行发布后问题解决。