记一次线上内存泄漏问题排查

一 故障描述

管理后台发现部分接口长时间无响应,此问题出现多次,每次都需重启项目就可以解决。查看日志发现多次出现java.lang.OutOfMemoryError: GC overhead limit exceeded,目前项目堆大小为固定2G,后台为内部人员使用,量不大。

二 处理过程

1 经过日志分析是GC问题,根据查资料确切的说于JVM花费太长时间执行GC且只能回收很少的堆内存时抛出的。根据Oracle官方文档,默认情况下,如果Java进程花费98%以上的时间执行GC,并且每次只有不到2%的堆被恢复,则JVM抛出此错误。
2 通过jstat -gc 30614 100查看内存使用状态,根据OC,OU发现老年代基本已经占满,而且FGC次数在此期间增加了两次。根据问题初步思考是内存泄漏引起的
在这里插入图片描述
根据命令jmap -heap 30614查看各分区具体占用印证
在这里插入图片描述

3 首先通过jmap -histo pid查看内存对象的分布情况,出现错误
30614: Unable to open socket file: target process not responding or HotSpot VM not loaded
The -F option can be used when the target process is not responding
经查资料需要切换至项目执行的用户,我们的是tomcat,于是切换至tomcat用户继续执行则成功。
在这里插入图片描述
4 命令jmap -histo 30614| sort -n -r -k 2 | head -10根据对象个数排序取前十个,命令jmap -histo 30614| sort -n -r -k 3 | head 10根据对象大小排序取前十,展示如下,发现GameTextBean异常
在这里插入图片描述
在这里插入图片描述
5 通过代码发现项目使用ehcache作为缓存管理,而每次缓存此对象使用的试一个List,内部存储的字段全是长文本内容以及其他标志字段,列表长度基本都在上万左右,而且缓存条数为1000条,过期时间设置为1小时,根据业务类型以及实际使用来看并不需要缓存这么多的数据量,于是修改配置,降低为20条,时间为2分钟,在此期间发现其他数据缓存也有不合理的地方因此根据实际重新配置了缓存。重新构建运行一段时间之后线上比较稳定,此问题未再发生。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
线上内存飙升是一个比较严重的问题,如果不及时处理,可能会导致系统崩溃。以下是一般的排查问题的过程: 1. 监控告警分析:系统应该有监控告警机制,如果内存使用率过高,应该及时发出告警并录监控数据。首先,需要分析告警信息和监控数据,确认内存使用率确实出现了异常。 2. 定位问题代码:通过监控工具、日志和代码调试等方法,确定哪些代码出现了内存使用率飙升的问题。可以使用 JVM 的内存分析工具,例如 jmap、jhat、jstack、VisualVM 等来分析内存使用情况,并找出内存泄漏的代码位置。 3. 解决问题代码:根据定位出的代码问题,进行修复。对于内存泄漏问题,需要分析代码中的对象生命周期,释放不再使用的对象,并检查是否存在对象引用未释放的情况。对于频繁创建和销毁对象、大对象等问题,需要优化代码逻辑,减少内存占用。 4. 测试验证:完成修复后,需要进行测试验证,确保问题得到了解决,并且没有引入新的问题。 5. 监控预警优化:针对该问题,需要优化监控预警机制,避免类似问题再次出现。可以增加更加详细的监控数据、设置更加敏感的告警阈值等等。 总之,线上内存飙升是一个比较严重的问题,需要及时发现、定位、修复和验证。同时,也需要优化监控预警机制,避免类似问题再次出现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值