2021-11-14

生产环境 JVM 内存溢出引发思考


前言

发生内存泄露,通常情况下是由于代码的原因造成的,一般无法立即对代码进行修复,很容易会发送连锁反应造成应用服务器一台一台接连宕机,故障面积会慢慢扩大,针对此种情况,应快速定位发生内存泄露的原因,将该服务进行降级,避免对其他服务造成影响。最简单的降级方法是根据 F5(Nginx)转发策略,对该功能定向到一个单独的集群,与其他流量进行隔离,确保其他业务不受牵连,给故障排查、解决提供宝贵的缓冲时间。


一、分析问题

首先可以通过查看日志,确定是哪种内存溢出,堆内存溢出可发生的地方:Java heap space(堆空间)、perm space(持久代)。
在这里插入图片描述

二、收集内存溢出Dump文件

1.收集dump文件

设置 JVM 启动参数

-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=/opt/jvmdump

使用 jmap 命令收集

jmap -dump:live,format=b,file=/opt/jvm/dump.hprof pid。

2.分析 Dump 文件

在获取 Dump 文件后,可以使用工具 MAT(MemoryAnalyzer)进行分析。
在这里插入图片描述
在这里插入图片描述
可以明确,堆的总大小为 1.9G,被 4 个线程全部占据,导致其他线程无法再申请资源,抛出堆内存溢出错误。
接下来,我通常的做法是直接去看【内存使用树状结构,见上文描述】(以线程为基本维度,查找线程中占用内存的对象),为后续定位排查提供必要的依据。
在这里插入图片描述
在这里插入图片描述
发现问题关键

org.apache.ibatis.executor.result.Defau

ltResultHandler 内部持有一个 List,其原始为 java.util.HashMap,从这个类基本可以看出是与数据库的查询相关,对数据库返回结果的解码并组织成 HashMap。这个 List 中的元素总共有 146033 个,初步可以判断出是在一次查询中从数据库中一次查询出了太多数据,造成了内存溢出。

由于 SQL 查询代码中,是用 HashMap 来接收数据库中的返回字段,无法一时间看出是那个查询,那我们能不能精确找到是哪一个查询,哪一行代码,甚至与哪一条 SQL 语句呢?

视图使用技巧:展开技巧:沿着使用率最高的项一层一层进行展开,直至发现具体占用内存的对象。接下来我们从 视图去寻找是哪个方法,哪条 SQL 语句触发的。
在这里插入图片描述
继续往上查找,要找到 SQL 语句,应该找到 Mybatis 处理结果集相关的类。


总结

日志是分析问题的经典策略,灵活地使用日志能够分析问题。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值