老年代内存飙升无法Gc问题

问题缘由:

某个项目调用我们的接口一直超时

问题表现:

老年代内存在20多分钟内突然急剧上涨,从300M涨到最大值512M,JVM频繁GC,GC暂停时间长,业务逻辑无法得到正常运行,大约5分钟后服务健康检查不通过,实例被自动重启。

问题发生频率:

近期每周都有1-2次

问题分析:

一、查看日志,线程数,请求并发量,网络io等无明显异常
二、dump文件分析

  1. 通过“Eclipse Memory Analyzer”(简称MAT)工具打开dump文件
    内存泄露这边就有个可疑的类,有10519个实例
    在这里插入图片描述
    2、接着点击histogram,根据retainHeap排序,同样能发现这个类在这里插入图片描述

3、这个类是怎么存储对象的。右键点击该类,在弹出菜单中按下图中选择对应菜单:
在这里插入图片描述
看到这个类有个属性是archives,是一个LinkedList,数量为10455,与第1张图的10577接近。同时,在size>0的情况下,为什么first=null?
在这里插入图片描述

4、翻看archievs相关的操作代码,它对象类型是LinkedList,属于线程不安全,在多线程的操作下却未有锁保护,猜测极有可能造成内部数据混乱,即:size > 0,但first == null。
5、翻看LinkedList的remove方法代码,发现如果first == null 是会报错的,而我们的业务代码直接吃掉了这个异常后返回,实际上压根就没有删除,这就是为什么内存会突涨的根本原因!
在这里插入图片描述

解决方案

用Collections.synchronizedList包装一下即可变成线程安全:

List<RequestRecord> archives = Collections.synchronizedList(new LinkedList<>());
  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
线上内存飙升是一个比较严重的问题,如果不及时处理,可能会导致系统崩溃。以下是一般的排问题的过程: 1. 监控告警分析:系统应该有监控告警机制,如果内存使用率过高,应该及时发出告警并记录监控数据。首先,需要分析告警信息和监控数据,确认内存使用率确实出现了异常。 2. 定位问题代码:通过监控工具、日志和代码调试等方法,确定哪些代码出现了内存使用率飙升问题。可以使用 JVM 的内存分析工具,例如 jmap、jhat、jstack、VisualVM 等来分析内存使用情况,并找出内存泄漏的代码位置。 3. 解决问题代码:根据定位出的代码问题,进行修复。对于内存泄漏问题,需要分析代码中的对象生命周期,释放不再使用的对象,并检是否存在对象引用未释放的情况。对于频繁创建和销毁对象、大对象等问题,需要优化代码逻辑,减少内存占用。 4. 测试验证:完成修复后,需要进行测试验证,确保问题得到了解决,并且没有引入新的问题。 5. 监控预警优化:针对该问题,需要优化监控预警机制,避免类似问题再次出现。可以增加更加详细的监控数据、设置更加敏感的告警阈值等等。 总之,线上内存飙升是一个比较严重的问题,需要及时发现、定位、修复和验证。同时,也需要优化监控预警机制,避免类似问题再次出现。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值