一、常见问题:
1、频繁发生 full GC
2、死循环、线程阻塞、IO wait
二、方法(定位代码)
思路一:
1、通过 top 命令定位到 CPU 最该的进程(一般是我们的应用进程)
top
2、定位使用 CPU 最高的线程
top -Hp pid
3、将线程 pid 转成 16进制
printf '0x%x' pid
4、找到 CPU 使用率最高线程堆栈(tid 就是 16进制的 pid)
jstack pid | grep tid
思路2 :
1、安装 Arthas
curl -O https://arthas.gitee.io/arthas-boot.jar
java -jar arthas-boot.jar
2、通过 thread -n 查看 cpu 消耗最高的线程
thread -n
三、具体原因具体分析
1、通过步骤二发现使用 cpu 最高的都是 GC 线程
1.1、查看 gc 日志,如果服务没有将 gc 日志保留下来,则使用后面两种方式。如果存在GC日志文件,使用GCeasy分析gc 的情况(https://www.gceasy.io/)具体可参考下面这篇文章: https://blog.csdn.net/CoderBruis/article/details/101234738
1.2、通过命令 jstat -gcutil 进程号 统计间隔毫秒 查看 gc 的情况
1.3、使用 arthas 的 dashboard 命令,实时查看线程、内存、gc 信息
涉及到full gc的问题常见情况如下:
1、survivor 区太小,对象过早进入老年代
2、大对象分配,没有足够的内存
3、old 区存在大量对象
2、发现使用 cpu 最高的是业务线程(基本可以通过查看业务日志可分析出来),常见问题如下
2.1、下游服务 响应时间(RT)过长
2.2、数据库慢 sql 或者数据库死锁
2.3、业务代码存在死锁(执行命令查看:jstack –l pid | grep -i –E 'BLOCKED | deadlock')
2.4、线程池满
记录学习的过程!!!