JVM调优之线上内存报警排查（二）

夏天99

于 2021-06-16 13:22:09 发布

阅读量617

点赞数 3

分类专栏： JVM调优文章标签： jvm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012506240/article/details/117955708

版权

JVM调优专栏收录该内容

2 篇文章 0 订阅

订阅专栏

JVM调优

第一章 JVM调优工具
第二章线上内存报警排查

文章目录

JVM调优
一、起因
二、排查思路
三、代码排查
四、改进方案
总结

一、起因

线上遇到CPU和内存使用率飙升告警，极端情况会触发云平台自动重启。

在这里插入图片描述

二、排查思路

提示：命令不清楚的请看上一章节或自行查询。

收到报警，查看报警，通过 top 指令发现CPU已经恢复正常。
对比没报警机器， jstat -gcutil 发现FGC次数比其他没触发报警的机器高。
猜测 cpu 飙高是由于GC导致的，为什么FGC之后内存使用率没降下来，反而增加了。一种情况是内存设置小于业务需要，另一种情况是有内存泄漏问题。
（1）查看jvm参数，堆大小为10G 基本上不会是大小不够用。
（2）通过jmap-histo:live查看内存存活对象占用情况。发现有500多万个WconfigHelper中的CallBack对象。

三、代码排查

WconfigHelper类CallBack对象。
业务方法调用信息如下：
CallBack方法和调用方均在虚拟机栈里，为什么方法执行结束对象没有回收？

最终callback对象被增加到了一个cacheSubscribeDatas本地缓存中。

由此可见，业务方每执行一次方法，就会new一个callback增加一个引用放本地缓存，所以导致这个对象越来越大，直到达到一定条件，触发FGC(导致cpu利用率飙升)。内存使用率也会越来越高，直到达到最大值down机触发云平台重启。

四、改进方案

通过jvm类加载机制将监听方法放到静态块中。保证对象只会创建一次。在这里插入图片描述
同时保证不被自定义线程池打断监听初始化过程。在服务启动时候调用init()方法，并且在每次业务调用时候检测下监听状态iMClueWatch是否正常。如果不正常，重新执行监听操作。

总结

这是我以前整理在有道里面的文章，最近才整理到CSDN，有些截图当时没有存储，有些私密代码做了马赛克，请见谅。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
JVM调优之线上内存报警排查（二）

系列文章目录第一章 JVM调优工具 [第二章线上CPU报警排查]文章目录系列文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。