问题描述:
在对notify执行性能测试时发现cpu负载突然飙高,cpu利用率高达95%。这时候就要排查是哪些线程消耗了cpu,并从代码层找到占用cpu的“罪魁祸首”。
步骤:
1. 先用ps+grep找到被测试的进程pid。
比如:ps –ef|grep notify,得到pid为29128。
2. 执行top -H -p <pid>,可显示出该进程下的所有线程。找到占用cpu最多的子线程pid,并将其转换为16进制。
比如:top -H -p 29128,看到notify的所有子线程。其中,%CPU 比重最大的子线程pid为879,转换成16进制是36f。
3. 执行jstack <pid>|less,查找子线程pid就能看到堆栈信息了。
比如:jstack 29128|less,再查找nid=0x36f,看到堆栈如下
"dispatcherTPConfig-6-thread-22" prio=10 tid=0x000000004dd84000 nid=0x36f runnable [0x000000004ae18000] java.lang.Thread.State: RUNNABLE at java.util.ArrayList.contains(ArrayList.java:199) <notify相关堆栈信息隐藏> …… |
4. 跟进堆栈中的方法信息定位到代码,接下来就是分析调优了。
后记:
用此方法可以简单、快速定位cpu消耗的原因,但是准确度不够理想。如果想深入查看消耗cpu top10的方法,可以使用专门的性能分析工具,例如oprofile、perf都可以实现。