现象
生产环境突然间大量接口超时告警,监控发现,问题发生的时间,cpu使率飙升,网络磁盘抖动大,内存使用率飙升,大约3-5分钟后系统自动恢复。
![cpu,网络监控异常](https://img-blog.csdnimg.cn/515d9b9108e24f209dcfcaaa3fcf5d0f.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbGF0ZXJ4aWU=,size_15,color_FFFFFF,t_70,g_se,x_16)
![内存磁盘监控异常](https://img-blog.csdnimg.cn/71cc1d5a6fab4ae29d60f5988581a2dd.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbGF0ZXJ4aWU=,size_15,color_FFFFFF,t_70,g_se,x_16)
异常分析思考
从监控看到,cpu,内存,磁盘,网络在异常发生时都有明显的抖动。
内存使用率突然飙升,应用IO也突然陡增。猜测可能是该时刻有定时任务,或者大量请求导致。问题发生时刻,细致对比变化时间,发现是首先网络IO飙升,磁盘突然增加,猜测可能是该时刻有大量请求导致。
综合分析下,我们猜测,最大可能是请求量突然暴增,导致系统负载过高,内存,cpu使用率飙升。
问题排查