OOM排查
模拟OOM情景
使用一个list引用方法里创建的对象让堆内存不断增加
打包之后,上传到服务器
nohup /usr/local/java/jdk17.0.8.1/bin/java -Xms512m -Xmx512m -jar /home/shortlink/OOM_demo-0.0.1-SNAPSHOT.jar > logs/OOM.log 2>&1 &
//在启动时设置发生OOM自动生成dump文件
发送请求触发OOM
线上解决办法
查看日志得知线上发生了OOM
把线上的dump文件下载下来,用专门的工具去分析(MAT),我这里用的是idea
分析dump文件
发现内存占用最大的为一个list集合,占260MB。
再根据controller去定位具体的接口,看这个对象被谁引用,是否因为不正确引用导致OOM
定位后发现,用了一个list不断存储新创建的对象,导致OOM。
至此,OOM排查完成,后续修改代码就可解决问题。
CPU飙升排查
线上CPU飙升情景
使用一个死循环模拟CPU飙升
触发CPU飙升
线上CPU的解决办法
发现服务器CPU飙升
定位对应的进程
- 使用top查询CPU的使用率,发现有一个JAVA进程占用率高达100%
进一步定位到对应的线程
- ps -mp 52679 -o THREAD,tid,time
- 把线程10进制id转成16进制
查看对应线程的堆栈信息
- jstack 线程id | grep 16进制id -A 20
分析堆栈信息
定位到对应的接口以及对应的代码行,找到问题所在之后,使用kill杀死死循环的线程,改正业务代码