记一次 CMS GC导致 FULL GC 时间开销很大的排查

最新推荐文章于 2024-04-26 15:41:23 发布

Agly_Charlie

最新推荐文章于 2024-04-26 15:41:23 发布

阅读量1.8k

点赞数

分类专栏： JVM 文章标签： jvm gc full gc

本文链接：https://blog.csdn.net/Agly_Clarlie/article/details/122082067

版权

2 篇文章 0 订阅

订阅专栏

背景

CMS（Concurrent Mark Sweep）收集器是 HotSpot 虚拟机第一款真正意义上的并发收集器，多线程标记清除算法，它第一次实现了让垃圾收集线程与用户线程（基本上）同时工作。

从名字中的Mark Sweep这两个词可以看出，CMS 收集器是一种 “标记-清除”算法实现的。整个过程分为四个步骤：

初始标记：暂停所有的其他线程，并标记一下 GC Roots 能直接关联的对象，速度很快；
并发标记：同时开启 GC 和用户线程，用一个闭包结构去记录可达对象。但在这个阶段结束，这个闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域，所以 GC 线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。
重新标记：需要暂停所有的工作线程，为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录。
并发清除：开启用户线程，同时 GC 线程开始对未标记的区域做清扫。

它是一款优秀的垃圾收集器，主要优点：并发收集、低停顿。但是它有下面的缺点：

项目中大量使用了本地缓存，使用 guava cache 缓存了很多数据。
对于CMS垃圾收集器，如果是大量本地缓存应用的话，重新标记阶段这个耗时就会较长，因为在并发阶段很容易有很多新对象进入缓存，从而重新标记阶段扫描很耗时，并且重新标记阶段是STW，暂停所有的工作线程。
当刚好进行并发阶段，同时缓存正在重新加载刷新的时候，就好会出现这个问题。

缓存设计上，减少不必要的缓存，如一些冷数据不再缓存。
开启-XX:CMSScavengeBeforeRemark，在重新标记阶段前进行一次YGC，有利于减少 Young Gen 对 Old Gen 的无效引用，从而减少重新标记阶段扫描GC Roots的开销。
尝试使用G1垃圾收集器，通过-XX:MaxGCPauseMillis设置最大停顿时间，提高服务可用性。
考虑团队用的JVM 收集器都是CMS，本次优化是减少缓存的使用，同时开启 -XX:CMSScavengeBeforeRemark

服务使用大量本地缓存，CMS GC收集器重新标记阶段导致STW时间很长。

Agly_Charlie

关注