系统:Linux
场景:应用服务器Server压测,出现CPU飙高,相应很慢
目的:快速定位CPU被什么玩意给占用了
思路:找到是哪个线程占用CPU最多,找到此线程上什么方法导致此线程占用CPU过多
解决方案和步骤:
linux服务器环境下,用jprofiler,jvm之类工具不方便,尤其像我这种对linux不是那么熟悉的小白,不能达到快速的目的,所以排除工具。用命令。
步骤:
1. top 拿到Server的
2. top -H -p进程ID ,
查看并且得到 占用CPU最高的
3. jstack -l进程ID
>> checkthread.log ,
查看进程堆栈信息,把堆栈信息打印到log里,方便查看,这一步可多次重复,以方便比较每次dump的堆栈信息
4.
将第二步拿到的十进制的转成十六进制,win7计算器就可以转哦
5. 用 十六进制
的 去第三步得到的log里搜索,查看此
线程具体堆栈信息,这样就查到原因咯
分析:
cpu飙高,load高,响应很慢
方案:
* 一个请求过程中多次dump
*
对比多次dump文件的runnable线程,如果执行的方法有比较大变化,说明比较正常。如果在执行同一个方法,就有一些问题了。
查找占用cpu最多的线程信息
方案:
* 使用命令: top -H -p pid(pid为被测系统的进程号),找到导致cpu高的线程id。
上述Top命令找到的线程id,对应着dump thread信息中线程的nid,只不过一个是十进制,一个是十六进制。
* 在thread dump中,根据top命令查找的线程id,查找对应的线程堆栈信息。
*多次dump,比较方法调用
cpu使用率不高但是响应很慢
方案:
* 进行dump,查看是否有很多thread
struck在了i/o、数据库等地方,定位瓶颈原因。
请求无法响应
方案:
* 多次dump,对比是否所有的runnable线程都一直在执行相同的方法,如果是的,恭喜你,锁住了!