内存分析工具MAT
【前言】:这里分享一个内存分析工具MAT的使用。同时记录分享当时使用此工具遇到的bug和大致解决思路。
一、下载安装
1.1 下载
官网下载地址:https://www.eclipse.org/mat/downloads.php
1.2 修改配置(可选)
某些版本可能不支持jdk8或以下,启动会报错,可尝试在配置文件指定本地jdk的位置。如果遇到大内存的dump文件,需要修改-Xmx参数,默认是1024m(其实大多数线上程序内存都会超)。
-vm
E:/jdk1.8.0_261/bin/javaw.exe
-Xmx8192m
某些文件可能不完整但也需要分析,可以设置告警等级:windows–>Preferences–>Memory Analyzer–>HPROF Parser。
1.3 启动
windows环境双击MemoryAnalyzer.exe启动。
二、使用
2.1 打开.hprof文件
file->open heap dump 打开文件
2.2 堆内存分析
打开文件后可以直观的看到问题分析,选择占用堆内存最多的问题,左键点击一下可以看到很多选项,选择需要的进行分析。
我们来了解其中的一些常用的工具和做一些概念解释:
Histogram from an arbitray set of Object(对象直方图):可以直观的展示所有类型的对象的个数,浅堆大小和深堆大小。这里解释下,shallow heap(浅堆):表示一个对象结构所占用的内存大小,即对象本身真实内存。retained heap(深堆):表示一个对象被GC回收后,可真实释放的内存大小,即包括对象本身和对象的所有引用占用的大小。
Dominator_tree(支配树):对象的支配树体现了对象之间的支配关系。和深堆有关联。
打开Dominator_tree面板,可以看到线程占用堆的大小和占比,一般找到占比最大的线程展开分析(或者说深堆与浅堆相差巨大的),找找有没有熟悉的类或方法或定位到哪一行代码。如下两张图片,第一张我展开找了会没找到很熟悉能定位到问题的代码,但是可以看出这大概是一个sql的问题。第二张图是我自己模拟的可以很快就定位到代码的位置和问题。
如果还不能定位到问题代码可以在overview里选择Leak Suspects,点击详情Details查看。如下:
可以定位到service层大概哪个方法报错,代码点进去看也差不多可以定位到。举的例子是我在实际工作中遇到的(不过由于没有设置oom自动导出,导出的文件应该是重启后的,不过也足够分析堆占比最大的调用有哪些),从图片上可以看到commonTrackList方法报错,可以定位到代码DelTrackServiceImpl类的第119行。然后跳进去看发现是一个大查询不断返回数据导致服务器oom的。其实最早从支配树试图(Dominator_tree)可以看到mybatisplus.core包下的LambdaOueryWarpper方法报错,上一个堆信息是ArraryList报错,就基本可以猜测到是某一次查询结果集深堆过大造成的oom。