1、故障现象
使用top命令查看服务器情况,发现CPU占用率过高。
2、CPU占用过高问题定位
2.1、定位问题进程
使用top -c和ps -ef|grep xw-......-service-2.0.0.jar命令查看资源占用情况,确定占用了大量CPU资源的进程。

2.2、定位问题线程
使用ps -mp pid -o THREAD,tid,time命令查看该进程的线程情况,发现该进程的多个线程占用率很高
ps -mp 28914 -o THREAD,tid,time查看cpu高的线程。
2.3、查看问题线程堆栈
挑选TID为14065的线程,查看该线程的堆栈情况,先将线程id转为16进制,使用printf "%x\n" tid命令进行转换
![]()
再使用jstack命令打印线程堆栈信息,命令格式:jstack pid |grep tid -A 30
jstack 28914 |grep 1bba -A 30

3、内存问题定位
3.1、使用jstat -gcutil命令查看进程的内存情况
平均每次Full GC耗时=(FGCT/220)。
jstat -gcutil 28914 2000 10

经过观察,在导入内容过多时,会造成CPU升高,当内容导出后CPU又会降低。
建议:减小导出报表的最大条数,目前是10万条,可以缓解导出内容过多时造成的CPU过高现象。
本文详细记录了服务器CPU占用率过高的排查过程,包括使用top命令发现异常、定位问题进程与线程、查看线程堆栈及内存问题的解决策略。
1206

被折叠的 条评论
为什么被折叠?



