JarFile实例多 Finalizer占用内存过大 引起的YGC时间过长 的问题排查和解决办法

故事起源

  已经记不清楚了是内存先告警还是CPU先告警的,而且还经常半夜告警,由此牵出了一系列的故事。。。。。。

问题描述

  当出现内存出现第一次告警的时候是在半夜,我通过命令查看指定服务器的GC情况,发现FGC次数比较多,然后使用命令进行dump。然后当我去拽文件的时候发现服务被重启了(团队中负责人强哥也收到了告警),我当时是在默认的工作目录下进行的dump,所以文件没有保存上。重启之后已经3点了,大家都没有睡意,就组了一把王者(茂哥和强哥说要带我,说带我赢,随便赢!结果青铜局被虐,他们骗我。。。。。。)

  等到上班的时候,我们再次查看服务的GC情况发现服务的YGC时间太长,竟然在1s~2s之间,如下图:

  看到这个时间的长度我们是很崩溃的,我们的服务并没有复杂的业务,这么长时间的YGC确实是不能忍受的。而且长时间的YGC还造成了我们服务的超时,CPU的峰值被拉高,然后就是一些列的告警。。。。
image.png

  为了查看大对象的引用,使用命令查看目前内存中的数据:

image.png

  dump之后使用MAT分析工具分析发现这个“java.lang.ref.Finlizer”的占用那是真的多啊!另外一个“LaunchedURLClassLoader”也不少:

image.png

  再来个柱状图分析的结果:

在这里插入图片描述

  树形展示看的更加清楚明晰:

在这里插入图片描述

  排除掉弱引用、虚引用、软引用的依赖之后,查看GC Root的保留之后我的内心是崩溃的,这是啥啊?完全没有我们的业务代码啊!

在这里插入图片描述
  这什么东西引起的链表那么深?
image.png

  当我再也没有力气点“next”查看链表的最后一个是什么的时候,茂哥发现了一个好东西,使用JProfile 查看GC Root的可视化界面(一屏拉不下,看不清楚就不用看了,不重要,只要知道很多就行了 ^ _ ^ ):

image.png

  看的我们头皮发麻。随后我们对项目中可能存在的“代码刺客”进行了一波优化:拆分请求量大的业务,优化循环BeanCopy,优化Number类型通过连接引号转字符串,更换G1垃圾收集器(用了一会就崩溃了,后续又换回了ParNewGC组合),调整堆大小和EDU的大小以及8:1这个比例。。。。。。

  优化过之后我们的YGC降到了0.3秒左右,内心当时真是欢欣鼓舞举国欢庆啊,心想着可算把这个问题解决了。

image.png

image.png

领导的怀疑

  当我们认为事情告一段落的时候,我们毅哥提出了质疑,因为0.3对于YGC来说还是有点长。因为我们另外一个项目的流量要比我们出问题的这个要大,但是那个服务的YGC都在100ms以内。因此怀疑还是我们的项目的某个地方出了问题(后续验证这个怀疑是正确的)。

  如果这样分析看来确实是有点问题,但是问题在哪里通过这个分析工具也没有明确的指示。以往的内存溢出我们使用工具很快就能够定位到问题,但是这个问题,确实蚌住了!

  因为项目中使用到了Mybatis-Plus,随后对这个产生了怀疑,茂哥在把Mybatis-Plus去掉之后发现YGC确实下降了,然后我们就开始重新分析。

在这里插入图片描述

  去项目的github上搜索了别人提出的issue看看有没有和“MybatisConfiguration”类似的问题,答案结果并不如意。然后继续去Google继续搜索。
image.png

  当看见这篇文章的时候我内心一激灵,这个问题貌似和我们的百分之99.99的类似啊,毕竟我们也使用了druid而且MySQL的连接jar也是8.X的,宇视我怀着激动的心情点进了这篇文章。

解决办法

升级Druid的版本号!

问题原因

这个问题,太坑了!!!!!!!!!!!!!!!
  根据原文里说的,是因为开启了空闲检测,而低版本的druid有个BUG。连接地址Druid版本BUG查看项目中版本源码(我们使用的是1.1.10版本)
image.png
image.png
  我们的配置完美“命中”!
image.png

github上相关的issue

image.png

  解决之后查看内存占用大小,再也看不到“JarFile”的问题了,真是太开心了!!!

image.png
在这里插入图片描述
image.png

耗时两周成功解决!

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MAT工具使用说明.docx MAT(Memory Analyzer Tool)工具入门 一MAT简介 MAT(Memory Analyzer Tool),一个基于Eclipse的内存分析工具,是一个快速、功能丰富的JAVA heap分析工具,它可以帮助我们查找内存泄漏和减少内存消耗。使用内存分析工具从众多的对象中进行分析,快速的计算出在内存中对象的占用大小,看看是谁阻止了垃圾收集器的回收工作,并可以通过报表直观的查看到可能造成这种结果的对象。 二 使用MAT意义 当服务器应用占用了过多内存的时候,会遇到OutOfMemoryError。如何快速定位问题呢?Eclipse MAT的出现使这个问题变得非常简单。它能够离线分析dump的文件数据。 四 MAT操作流程 1先调用jdk的工具得到heap使用情况 我安装的是jdk1.6 C:/>java -version java version "1.6.0_11" Java(TM) SE Runtime Environment (build 1.6.0_11-b03) Java HotSpot(TM) Client VM (build 11.0-b16, mixed mode, sharing) 2调用jdk工具jps查看当前的java进程 C:/>jps 3504 Jps 3676 Bootstrap 3496 org.eclipse.equinox.launcher_1.0.201.R35x_v20090715.jar 3调用jmap工具得到信息 C:/>jmap -dump:format=b,file=heap.bin 3676 Dumping heap to C:/heap.bin ... Heap dump file created 这时,我们的C盘根目录,就生成了heap.bin文件。 4用eclipse的file---->open打开这个文件,首先是一个启动图: 这里可以选择查看 (1)内存泄露报表,自动检查可能存在内存泄露的对象,通过报表展示存活的对象以及为什么他们没有被垃圾收集; (2)对象报表,对可颖对象的分析,如字符串是否定义重了,空的collection、finalizer以及弱引用等。 我这里选择的是查看内存报表,以下是截的简略图: 通过报表展示,蛮清楚的,下面还有详细的说明,这里就没有帖图了,有兴趣的可以继续探究。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值