最近一段时间 某台服务器上的一个应用总是隔一段时间就自己挂掉 用top看了看从重新部署应用开始没有多长时间CPU占用上升得很快
排查步骤
1.使用 top 定位到占用CPU高的进程PID,如图中的733
top
2.通过 ps aux | grep PID命令 获取线程信息,并找到占用CPU高的线程
ps -mp 733 -o THREAD,tid,time | sort -rn
3.将需要的线程ID转换为16进制格式
printf "%x\n" 755
4.打印线程的堆栈信息 到了这一步具体看堆栈的日志来定位问题了
jstack 733 |grep 307 -A 30
显示是 SmsQueueServiceImpl 中的produceMissSms 和 consumeMissSms 方法有问题
重新部署后 cpu占用就正常了