场景:订单系统oom,内存分析
定位过程:
第一步获取堆内存dump文件:
这里的内存是缓慢上升的所以可以通过以下方法获取堆内存dump文件:
- 通过命令 jmap 加上jar进程号打印出dump文件, 进程号可以通过以下命令查看(jmap打印的视乎不全,优先使用2.jcmd打印实时堆信息):
得到进程号后,打印dump文件命令(其中12176为进程号)ps aux|grep jar
jmap -dump 文件名 $pidjmap -dump:live,format=b,file=/home/dev/saas.heap.hprof 12176
- 通过命令 jcmd 加上jar进程号打印出dump文件, 进程号可以通过以下命令查看:
得到进程号后,打印dump文件命令(其中12176为进程号)ps aux|grep jar
jcmd $pid GC.heap_dump 文件名jcmd 12716 GC.heap_dump /home/dev/jcmd.heap.saas.hprof
- 通过jar启动参数配置,自动生成dump文件(在oom时,垃圾回收(FullGC)时等)
在启动jar包是加上参数: -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/tmp/heapdump.hprof
这里的+HeapDump有多个场景 -XX:+HeapDumpBeforeFullGC (fullgc之前) -XX:+HeapDumpAfterFullGC (fullgc之后)等等等...
第二步使用分析器分析堆内存dump文件:
这里可用使用两种工具打开dump文件,visualvm和 eclipse 的 MAT
1.visualvm打开文件分析:
vm需要人肉分析,看个人经验吧,多用用就好
2.使用MAT(MemoryAnalyzer)分析Dump文件(这里重点介绍MAT,使用的是一个orders服务的dump文件示例)
打开MemoryAnalyzer软件,使用file->open heap dump打开dump文件
MemoryAnalyzer会自动分析
选择文件后选择报告类型,分析内存oom一般选择 Leak Suspects Report接口
分析完成后会列出Problem Suspect(可疑点)
点击每个可疑可以查看详情,包括占用内存,Biggest Instances(大的实例)等,点击Details可以查看更多细节(根本问题一般都隐藏在这里)
在详情里我们检查Biggest Instances(大的实例),我们看到第一个实例就占用了19,712,528b(18.8mb),http-nio线程可以确定是http请求处理过来的,点进去看看内部对象
选择对象列表我们查看内部的对象
这里可以先使用shallow heap排个序,这里有个大的byte数组,左边可以看到他的值的一个缩略信息,一般这里就能定位到占用内存的大对象了,这里是订单列表
这里还可以看到更多信息比如controller,service,uri都是可以找到的