概述
最近接到IDC监控告警说某台服务器cpu过高,下面记录下故障排查的过程,仅供参考,这里主要看思路,细节不重要。
1、观察服务器资源消耗
可以看到服务器表现为cpu问题,内存消耗正常。
![806667e0c932402e465c4329b77148fe.png](https://img-blog.csdnimg.cn/img_convert/806667e0c932402e465c4329b77148fe.png)
![0c9ad7e043081da5b82a28684a94c0b3.png](https://img-blog.csdnimg.cn/img_convert/0c9ad7e043081da5b82a28684a94c0b3.png)
1.1、查看具体cpu
ps -mp 2289 -o THREAD,tid,time
![f8066239351cb445c8615c44a8657833.png](https://img-blog.csdnimg.cn/img_convert/f8066239351cb445c8615c44a8657833.png)
![41ce977be46fb93039f1358d47397102.png](https://img-blog.csdnimg.cn/img_convert/41ce977be46fb93039f1358d47397102.png)
1.2、找到耗时最高的线程TID,并将其线程ID转换为16进制格式
最近接到IDC监控告警说某台服务器cpu过高,下面记录下故障排查的过程,仅供参考,这里主要看思路,细节不重要。
可以看到服务器表现为cpu问题,内存消耗正常。
1.1、查看具体cpu
ps -mp 2289 -o THREAD,tid,time
1.2、找到耗时最高的线程TID,并将其线程ID转换为16进制格式