生产服务器上部署了几个java程序,突然出现了CPU100%的异常告警,你如何定位出问题呢?
以下为两种系统下的排查步骤,都是一模一样的,只是命令稍有区别
- 查消耗cpu最高的进程PID
- 根据PID查出消耗cpu最高的线程号
- 根据线程号查出对应的java线程,进行处理
准备一行死循环代码 并运行:
for (int i = 0; i < 100; ) {
i = i * i;
}
windows版(windows server)
查消耗cpu最高的进程PID
手边没有windows server机器,我以win 10为例,截图给大家看一下,先调出PID显示项!
然后发现进程PID如下图所示,为1732
根据PID查出消耗cpu最高的线程号
这里用到微软的工具Process Explorer v16.22,地址如下
https://docs.microsoft.com/zh-cn/sysinternals/downloads/process-explorer
发现最耗cpu的线程的TId为10100
这是十进制的数据,转成十六进制为2774
根据线程号查出对应的java线程,进行处理
执行命令,导出进程快照 jstack -l 1732 > c:/1732.stack (指定位置)
打开文件1732.stack 搜索 2744 可定位到对应的线程
linux版
查消耗cpu最高的进程PID
执行命令
执行top -c ,显示进程运行信息列表。按下P,进程按照cpu使用率排序
根据PID查出消耗cpu最高的线程号
执行命令
top -Hp 3033 ,显示一个进程的线程运行信息列表。按下P,进程按照cpu使用率排序
如下图所示,PID为3034的线程耗费cpu最高
这是十进制的数据,转成十六进制为0xbda
根据线程号查出对应的java线程,进行处理
执行命令,导出进程快照
jstack -l 3033 > ./3033.stack
然后执行,grep命令,看线程0xbda做了什么
cat 3033.stack |grep ‘bda’ -C 8