记一次JVM生产OOM及后续调优

最新推荐文章于 2023-04-05 00:01:01 发布

tanwubo

最新推荐文章于 2023-04-05 00:01:01 发布

阅读量687

点赞数

分类专栏：随笔文章标签： java jvm bug

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22606825/article/details/104938627

版权

随笔专栏收录该内容

11 篇文章 2 订阅

订阅专栏

2020年03月18日，开年第一个生产事故发送在我的项目组o(╥﹏╥)o

事故发生

在下午2点40时，收到了第一个客户投诉，紧接着收到了第二个、第三个。
并且不断的有各业务系统表示自己的系统出现了操作无响应的现象，如此大范围的影响，推测大概率是网关的功能出现了问题。

事故定位

立马上日志平台搜索Nginx处的请求日志，果然在Nginx上发现了大量的499响应码日志，紧接着拿着top 1请求量的499接口来搜索安全网关的日志，发现了大量的：java.lang.OutOfMemoryError: GC overhead limit exceeded，由于怕过年期间生产不稳定，从年前开始，已经很长时间都没有发布了，所以排除了新增的代码BUG。

解决

那么就有可能是长时间运行慢慢堆积的对象导致的OOM，直接重启安全网关，重启后成功解决。

复盘

java.lang.OutOfMemoryError: GC overhead limit exceeded根据官方的解释是在多次gc后效果极差抛出的OOM。
怀疑可能存在内存泄漏，直接分析OOM后的dump文件。
在这里插入图片描述
从Dominator Tree图中排出占用内存最大的top n对象，挨个查看它的GC root：

再切换到Histogram，同样排出占用内存最大的top n对象，挨个查看GC root。

调优

分析后发现skywalking和spring产生了大量的Class对象，skywalking产生了大量的Endpoint对象，spring产生了大量的动态代理对象。并没有自身代码产生的内存泄漏对象。

适当的调大JVM堆大小
进一步调查Endpoint对象，是否可以控制过期时间。

事故的调查期间还发现了服务自启动以来只有过2次full gc，都是在启动初期由于Metaspace空间不足扩容导致的full gc，所以还需要调整Metaspace空间。

-XX:MetaspaceSize=128M

另外，我还调低了MaxTenuringThreshold，这个参数影响进入老年代的年龄阈值。
因为网关的对象都是请求级别的生命周期，分析gc日志可以知道young gc平均在30s执行一次，MaxTenuringThreshold的默认值是15，会导致部分长期存活对象需要将近8分钟的时间才能进入老年代，本来年轻代的空间就不大，再被这些长期存活对象一占用，会使得young gc更加频繁。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
记一次JVM生产OOM及后续调优

上线后使用jstat大致监控一下JVM的gc状况，jstat命令使用。查看到服务有过2次full gc，这是不应该发生的，因为这是个网关服务，绝大多数对象都是请求级别的生命周期，基本不会有长期对象产生，也不会有持续的大对象产生，所以不应该发生full gc才对。服务启动时有加上-XX:+PrintGCDetails，找到gc日志，找到第一次full gc的位置：非常清晰的标出了是Metasp...
复制链接

扫一扫

专栏目录

tanwubo CSDN认证博客专家 CSDN认证企业博客

码龄10年

27: 原创

7万+: 周排名

178万+: 总排名

9万+: 访问

: 等级

1053: 积分

20: 粉丝

37: 获赞

17: 评论

177: 收藏

私信

关注

热门文章

分类专栏

最新评论

Sentry离线部署
xugende: 楼主帮忙看下是啥导致的
Sentry离线部署
xugende: 执行install.sh脚本过程存在报错报错信息如下： Checking minimum requirements... ./install.sh: line 42: [: : integer expression expected Creating volumes for persistent storage... Created sentry-data. Created sentry-postgres. .env already exists, skipped creation. $SENTRY_IMAGE not set, using latest stable: sentry:9.1.2 Building and tagging Docker images... smtp uses an image, skipping memcached uses an image, skipping redis uses an image, skipping postgres uses an image, skipping Building web Step 1/2 : ARG SENTRY_IMAGE Step 2/2 : FROM ${SENTRY_IMAGE}-onbuild # Executing 4 build triggers ---> Using cache ---> Running in e7aa093b6bfc ERROR: Service 'web' failed to build: dial unix /run/containerd/s/2ef68a6d0af39f19ae25029b51884828b88c7a3714dcd873f31fed620f5ed579: connect: connection refused: unknown Cleaning up...
Apollo源码阅读记录（一）
翟羽嚄: 我以为百度apollo自动驾驶的，建议加个前缀
Docker学习笔记-volumes(一)
宛决汐: docker run -d --name my_test --mount src=hact-ucpv-247ac6d1b0bb64804eed2d0c4345a8ec,target=/usr/src 这命令有什么不对嘛给我报错了 "docker run" requires at least 1 argument. See 'docker run --help'. Usage: docker run [OPTIONS] IMAGE [COMMAND] [ARG...] Run a command in a new container
Sentry离线部署
winfred_hua: 请问楼主，Sentry所使用的环境（例如exim4.tar），你是在哪里下载的？方便提供一下网址吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。