1.使用top 定位到占用CPU高的进程PID
看%CPU和COMMAND,CPU最高的可能100%或以上,COMMAND是java或Tomcat等,记下进程PID的值。
2.通过ps命令查找进程PID下,那个线程耗CPU
可以使用ps --help all查看用法
ps -Lfp pid
ps -mp pid -o THREAD, tid, time | sort -rn
-f 全部列出
-p pid 进程使用cpu的时间
-m 显示所有的线程
L 列出栏位的相关信息
可以看出上一步的systemd进程ID是1,只有一个线程ID也是1,是ep_pol
也可以使用top -Hp pid
-p 通过指定监控进程ID来仅仅监控某个进程的状态
同理可以看出线程ID是1.
3.将需要的线程ID转换为16进制格式
printf "%x\n" 线程tid #\n用于换行
这里做这一步是因为jstack 进程ID的内容显示的线程信息中线程ID nid是16进制的,才能grep 查找。
4.打印线程的堆栈信息 到了这一步具体看堆栈的日志来定位问题了
jstack pid | grep tid -A 60
jstack PID | grep TID
"TestThread" prio=10 tid=0x0000xxxxxxxxx nid=0x8e6 in Object.wait()
java.lang.Thread.State : RUNNABLE
at xxx.xxx.xxx.class.xxxmethod(xx.java:xx行)
xxx栈信息,可以看出自己写的代码栈信息,分析自己的源码,从外到内逐步排查原因