这里对linux下、sun(oracle) JDK的线程资源占用问题的查找步骤做一个小结;
linux环境下,当发现java进程占用CPU资源很高,且又要想更进一步查出哪一个java线程占用了CPU资源时,按照以下步骤进行查找:
(一):通过【
top
-p12377 -H
】 查看java进程的有哪些线程的运行情况;
和通过【jstack 12377 > stack.log】生成Java线程的dump详细信息;
-
- 先用top命令找出占用资源厉害的java进程id,如图:# top
- 如上图所示,java的进程id为’52554′,接下来用top命令单独对这个进程中的所有线程作监视:
-
1
top
-p52554 -H
# top视图里面里面可以通过快捷键依次b ,x高亮显示top的列找出需要的线程,默认CPU排序,Shift+< ,Shift+>可以左右移动高亮排序的列;
如图:(这时就看出来哪个java线程CPU高,哪个线程内存用的多)
- 如上图所示,linux下,所有的java内部线程,其实都对应了一个进程id,也就是说,linux上的sun jvm将java程序中的线程映射为了操作系统进程;我们看到,占用CPU资源最高的那个进程id是’15417′,这个进程id对应java线程信息中的’nid’(‘n’ stands for ‘native’);
- (1)要想找到到底是哪段具体的代码占用了如此多的资源,先使用jstack打出当前栈信息到一个文件里, 比如stack.log:
- python -c
"print hex(9757)"然后记住二进制的号
cat stack.log|grep 二进制的号
-
1
jstack 52554 > stack.log
然后使用’jtgrep’脚本把这个进程号为’9757′的java线程在stack.log中抓出来:
1
jtgrep 9757 stack.log
其中,’jtgrep’是自己随便写的一个shell脚本:
1
#!/bin/sh
3
nid=`python -c
"print hex($1)"
`
4
grep
-i $nid $2
道理很简单,就是 把’9757′转换成16进制后,直接grep stack.log;可以看到,被grep出的那个线程的nid=0x3c39,正好是15417的16进制表示。