一段以往生产跑着正常的数据,突然某一段时间就有问题,但是没有谁实时盯着生存,只是有部分error日志,但是又没有详细的日志;无法分析、无法衡量;
1、生存error日志的时间节点,分析,该时间段以来,哪些相关的业务发生了变更,特别是源头,必入数据来源(APP、PC、来源DB)
2、如果dev、test、uat环境没办法重现问题、请考虑尝试把N台生产机器中的一台替换成增加详细日志后,再进行跟进,没有什么比日志更能说明问题,如果你还是没能发现问题,那是因为你的日志打得不够详细,最详细的日志就是远程debug调试。
3、请保持好你的情绪,不论问题是何原因造成,不论这个锅你背得有多么的郁闷,按自己的节奏做事情吧, 因为你没有办法,否则 你可以选择负责任地离开
4、说话客客气气,嘴是用来品尝美食、亲美女的,而不是随意说话的,用大脑分析来说话。
5、下面是增加详细日志后的error日志,错误点很明显