写在前面的话
应某位友人需求,帮整理下工作中的发生的一些值得记录的文章。于是在友人口述后,表姐为其整理为了文章,供大家一起参考探讨。
一、起因
那天早上一到公司就有客服过来反应我们的App登录不了了,我赶紧试了一下登陆App,发现是可以登录的,就以为是个别现象没有在意。过了一会儿客服来反应更频繁了,这才意识到可能没有那么简单。
二、分析
一开始认为是服务器问题,检查了所有相关的应用服务器,应用是否正在运行,发现一切正常,cpu、内存、IO 都是正常的,没有异常;
然后考虑是否是代码层面问题(数据库问题被排除,因为一旦数据库出问题不可能只有一部分人受影响),于是去检查日志,发现有以下错误信息:
然后登陆redis控制台,一台一台测试,终于发现了有问题的那台机器: