java ygc 频繁_JVM成长之路,记录一次内存溢出导致频繁FGC的问题排查及解决

num#instances #bytes class name

----------------------------------------------

1:1001750155802576[B

2:13795432307952[C

3:98342423602176java.util.LinkedList$Node

4:1346173230808java.lang.String

5:348673091056[Ljava.util.HashMap$Node;

6:747482391936java.util.HashMap$Node

7:341561639488java.util.HashMap

8:89321523896[Ljava.lang.Object;

9:82161508664[Ljava.util.concurrent.ConcurrentHashMap$Node;

10:163931311440org.apache.zookeeper.data.Stat

11:351501124800java.util.concurrent.ConcurrentHashMap$Node

12:7604847288java.lang.Class

13:49187786992java.util.concurrent.atomic.AtomicReference

14:16393655720org.apache.curator.framework.recipes.cache.TreeCache$TreeNode

15:1704640704java.lang.Thread

16:8373535872java.util.concurrent.ConcurrentHashMap

17:33135530160java.util.HashSet

这是什么???

1:1001750155802576[B

果断看不出这是什么?

回忆一下:

比较明显的现象:

1. O区满的。

2. E区却没有满。

[deploy@dipper_prd_2 ~]$ jstat -gccause 26003 1000

S0     S1     E     O      M     CCS    YGC     YGCT    FGC    FGCT     GCT    LGCC                 GCC

0.00   0.00  58.63  99.93  97.37  96.66    280    6.302   111   37.851   44.153 Allocation Failure   No GC

3.FGC 次数增了,YGC倒是没有增长。

E区没满,O却满了。!!有什么奇怪的东西跑进了O区吗???????看了一下代码。最近Node修改的只有日志。读日志!!读日志 生成的对象 E没满 并不会进O区! 排除读日志的影响!

那 到底是什么奇怪的东西进入了O区??

看了一圈代码。发现不了问题。。

只能用终极大法了。dump堆内存分析。

dump堆内存到文件中通过MAT软件分析。

安装好eclipse的memory analysis tool (MAT),切换成mat视图。将文件导入到eclipse中。

不分析不知道。 一分析吓一跳!! 看到没有,内存中最大的那块区域!!是一个concurrentHashMap!!!!!!!!!

0818b9ca8b590ca3270a3433284dd417.png

0818b9ca8b590ca3270a3433284dd417.png

原来是有个concurrentHashMap在作怪!!

为什么这个对象会占据如此多的内存!查看代码后发现。这个concurrentHashMap 在NodeContext中。

这个数据结构存储了所有运行的作业的信息。 每新进一个 作业,会在此结构添加一个Code对象。

然而。 从未调用过remove方法!!!!!! 这块又是个单例对象的static对象,从来不会被回收。只进不出,内存溢出!Node跑一两天就完蛋!!

public classNodeContext{

private staticNodeContext ourInstance= newNodeContext();//存储用户的代码private staticMap codesMap;public staticNodeContext singleton() {

returnourInstance;}

privateNodeContext() {

codesMap= newConcurrentHashMap<>();scheduler= SchedulerFactory.singleton().createOrGetParallelScheduler(NodeConfig.PARALLELISM_MAX_NUM);}

}

解决:

解决过程中又遇到了一个坑!!!

错误解决:在一个实例运行完的代码finally部分调用NodeContext.remove(codeId) 移除掉这个运行的实例!!!

发布测试环境!!! 运行报错!!!!

正确解决:

在监听实例 上报状态到ZK后再做 这个移除操作!!!

修改后的现象:

第一天:

S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT    LGCC                 GCC

0.00  18.29  97.31  50.26  97.42  95.25     41    0.855     2    0.393    1.247 Allocation Failure   No GC

0.00  18.29  97.80  50.26  97.42  95.25     41    0.855     2    0.393    1.247 Allocation Failure   No GC

0.00  18.29  99.27  50.26  97.42  95.25     41    0.855     2    0.393    1.247 Allocation Failure   No GC

21.00   0.00   0.07  50.27  96.99  95.31     42    0.879     2    0.393    1.272 Allocation Failure   No GC

21.00   0.00   0.89  50.27  96.99  95.31     42    0.879     2    0.393    1.272 Allocation Failure   No GC

21.00   0.00   2.12  50.27  96.99  95.31     42    0.879     2    0.393    1.272 Allocation Failure   No GC

21.00   0.00   2.95  50.27  96.99  95.31     42    0.879     2    0.393    1.272 Allocation Failure   No GC

21.00   0.00   3.91  50.27  96.99  95.31     42    0.879     2    0.393    1.272 Allocation Failure   No GC

21.00   0.00   4.49  50.27  96.99  95.31     42    0.879     2    0.393    1.272 Allocation Failure   No GC

21.00   0.00   5.10  50.27  96.99  95.31     42    0.879     2    0.393    1.272 Allocation Failure   No GC

第二天:O区只增长了2%

S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT    LGCC                 GCC

0.00  97.82  50.26  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.26  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.26  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.26  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.26  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.26  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.27  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.27  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

0.00  97.82  50.27  52.21  97.59  95.44     53    1.012     2    0.393    1.405 Allocation Failure   No GC

若干天后:发生了一次FGC 但是 O区已经降低至 30.18% 到此,成功解决此内存溢出的问题!!!

[deploy@dipper_prd_2 ~]$ jstat -gcutil 3519 1000

S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT

0.00   4.45  65.14  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.14  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.14  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.15  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.15  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.15  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.15  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.15  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.18  30.18  96.89  93.87    671    5.568     3    0.742    6.310

0.00   4.45  65.18  30.18  96.89  93.87    671    5.568     3    0.742    6.310

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值