车祸现场
整个服务异常维持时间:
某日持续两小时;直到运维重启服务之后,得以恢复正常;
现象:
- xx系统一共两台机器,仅xx机器出现服务异常;
- 外部调用xx系统xx机器,均能够正常进入;
- xx系统xx机器,调用外部api,在整个事故过程中,均抛出异常;
- 异常信息极其简单“restExchangeMap失败:null”,没有完整的错误栈信息;
寻找完整错误栈信息
通过阅读代码,在寻找完整的错误栈信息过程中,发现几点问题:
1,在catch异常的过程中,没有输出完整的错误栈信息(如果考虑日志性能的问题,请捕获已知的异常,简化输出,未知异常,请一定输出完整错误栈信息);
2、在通用的controller中发现有捕获全局异常,但是下面这样的日志输出,并不能够输出完整错误栈信息;