有时候因为代码问题,线上应用会出现cpu占用高的问题,比如长期cpu100%高负载,这是非常危险。
这时,我们可以使用jstack命令来快速定位到是哪一段代码,这对于我们解决问题会十分有帮助。
一、制造一个页面无响应的场景
为了制造这种现象,这里写一个死循环。
先创建一个SpringBoot项目并添加一个Controller。
while是一下死循环,运行到天荒地老,海枯石烂都不会停下来。
打包部署到Linux服务器,成功启动后。
访问这个地址。
是页面这时卡住了,一直等待响应。
二、java定位进程
在服务器中终端输入命令:top
可以进程ID,为5421的cpu这列100多了。
记下这个数字:5421
三、定位问题进程对应的线程
然后在服务器中终端输入命令:top -Hp 5421
作用是查看里程内部线程资源占用情况。5421为第二步获取到的进程id
可以看到第一行cpu占用特别高,就是它了。记住,此时第一列PID是线程ID:5463
注意这个ID是十进制,但是java线程堆栈是采用是16进制。那么我们转换一下。
printf "%x\n" 5463
输出结果:
1557
四、通过jstack命令找到线程对应代码
现在我们需要用到之前的进程ID和线程的16进制数字。
在服务器中终端输入命令:jstack -l 5421|grep 1557 -C 8
可看到线程处于运行状态,代码在BugDemoController类的17行,也就是我们的循环所在行。
这里解释一下grep后页-C 8意思是显示查找目标行的前后8行,不加的话就只有一行,可能一时看不出问题来。
当然你也可以更改一下:
-A 8后8行
-B 8前8行
PS:本例方法也可用于排查线上死锁问题。