深入JVM十：JVM中的垃圾收集器

最新推荐文章于 2024-07-19 18:01:35 发布

bingaPang

最新推荐文章于 2024-07-19 18:01:35 发布

阅读量127

点赞数 1

分类专栏： jvm 文章标签： jvm java

本文链接：https://blog.csdn.net/pang5356/article/details/108554929

版权

jvm 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

标题

如果说垃圾收集算法是垃圾收集的理论的话，那么垃圾收集器就是垃圾收集理论的实现，接下来来分别了解Serial、ParNew、Parallel Scavenge、CMS、G1等垃圾收集器。

Serial收集器

关于指定使用Serial收集器的JVM参数如下：

-XX:+UseSerialGC 作为年轻代垃圾收集器
-XX:+UseSerialOldGC 作为老年代垃圾收集器

Serial（串行）收集器是最基本、历史最悠久的垃圾收集器了。大家看名字就知道这个收集器是一个单线程收集器了。它的 “单线程” 的意义不仅仅意味着它只会使用一条垃圾收集线程去完成垃圾收集工作，更重要的是它在进行垃圾收集工作的时候必须暂停其他所有的工作线程（ “Stop The World” ），直到它收集结束。

新生代采用复制算法，老年代采用标记-整理算法。

在这里插入图片描述
虚拟机的设计者们当然知道Stop The World带来的不良用户体验，所以在后续的垃圾收集器设计中停顿时间在不断缩短（仍然还有停顿，寻找最优秀的垃圾收集器的过程仍然在继续）。但是Serial收集器有没有优于其他垃圾收集器的地方呢？当然有，它简单而高效（与其他收集器的单线程相比）。Serial收集器由于没有线程交互的开销，自然可以获得很高的单线程收集效率。 Serial Old收集器是Serial收集器的老年代版本，它同样是一个单线程收集器。它主要有两大用途：

一种用途是在JDK1.5以及以前的版本中与Parallel Scavenge收集器搭配使用（在JDK1.9取消了这种组合）。
另一种用途是作为CMS收集器的后备方案。

注意：单线程不仅是指开启一个线程收集垃圾，更重要的是在进行垃圾收集是必须暂停其他所有线程，也就是垃圾和应用程序是串行化的，所有叫Serial收集器，Serializable串行化的意思。同时，开启单线程那么在多核服务器上运行很明显不会充分利用多核的优势。

ParNew垃圾收集器

指定使用ParNew垃圾收集器的JVM参数如下：

-XX:+UseParNewGC

ParNew是一款新生代垃圾收集器，一般来说是作为CMS垃圾收集器的默认年轻代垃圾收集器。
ParNew收集器其实就是Serial收集器的多线程版本，除了使用多线程进行垃圾收集外，其余行为（控制参数、收集算法、回收策略等等）和Serial收集器完全一样。默认的收集线程数跟cpu核数相同，当然也可以用参数(-XX:ParallelGCThreads)指定收集线程数，但是一般不推荐修改。

新生代采用复制算法，老年代采用标记-整理算法。

在这里插入图片描述
它是许多运行在Server模式下的虚拟机的首要选择，除了Serial收集器外，只有它能与CMS收集器（真正意义上的并发收集器，后面会介绍到）配合工作。

Parallel Scavenge垃圾收集器

指定年轻代和老年代使用Parallel Scavenge垃圾收集器的JVM参数如下：

-XX:+UseParallelGC(年轻代)
-XX:+UseParallelOldGC(老年代)

Parallel Scavenge 收集器类似于ParNew 收集器，是Server 模式（内存大于2G，2个cpu）下的默认收集器，那么它有什么特别之处呢？
Parallel Scavenge收集器关注点是吞吐量（高效率的利用CPU）。CMS等垃圾收集器的关注点更多的是用户线程的停顿时间（提高用户体验）。所谓吞吐量就是CPU中用于运行用户代码的时间与CPU总消耗时间的比值。 Parallel Scavenge收集器提供了很多参数供用户找到最合适的停顿时间或最大吞吐量，如果对于收集器运作不太了解的话，可以选择把内存管理优化交给虚拟机去完成也是一个不错的选择。
吞吐量计算公式：

吞吐量 = 运行用户代码时间 / (运行用户代码时间 + 运行垃圾收集时间)

接下来来说以说Parallel Scavenge垃圾收集器的量重要的参数：

-XX:MaxGCPauseMillis
-XX:GCTimeRatio

首先来说一下-XX:MaxGCPauseMillis，指定的每次GC最大的停顿时间。这是一个大于0的参数，指定在Parallel Scavenge在做垃圾回收时尽可能保证垃圾收集时间在指定的范围内。但是指定该参数不代表Parallel Scavenge在垃圾收集上就会效率提高，它会为了达到指定的参数返回，从而缩短相应的回收时间，但是会增加回收的次数，假如原先是每10秒回收一次，回收时间是100毫秒，但是指定参数后，没5秒回收一次，每次回收时间为70毫秒，相应的吞吐量就下降下来了。
再来看-XX:GCTimeRatio，该参数值为一个大于0小于100的整数，也就是垃圾收集时间在总时间的比例，如该参数位19，那么允许垃圾收集时间占总时间的5%，即1 / (1 + 19)。
由于Parallel Scavenge是一个与吞吐量相关的垃圾收集器，除去上面的两个参数，其还有一个-XX:+UseAdaptiveSizePolicy参数，当该参数激活后，那么就不需要手动指定年轻代、Eden与Survivor比例等参数了，其会随着JVM的运行动态调整。如果对Parallel Scavenge不是太熟悉，可以通过激活该参数，然后指定上-XX:MaxGCPauseMillis和-XX:GCTimeRatio两个参数指定优化目标，剩下的交给Parallel Scavenge即可。
Parallel Scavenge收集过程如下：
在这里插入图片描述
Parallel Old收集器是Parallel Scavenge收集器的老年代版本。使用多线程和“标记-整理”算法。在注重吞吐量以及CPU资源的场合，都可以优先考虑 Parallel Scavenge收集器和Parallel Old收集器。

新生代采用复制算法，老年代采用标记-整理算法。

CMS垃圾收集器

CMS（Concurrent Mark Sweep）收集器是一种以获取最短回收停顿时间为目标的收集器。它非常符合在注重用户体验的应用上使用，它是HotSpot虚拟机第一款真正意义上的并发收集器，它第一次实现了让垃圾收集线程与用户线程（基本上）同时工作。
从名字中的Mark Sweep这两个词可以看出，CMS收集器是一种 “标记-清除”算法实现的，它的运作过程相比于前面几种垃圾收集器来说更加复杂一些。整个过程分为四个步骤：

初始标记：暂停所有的其他线程，并记录下GC Roots直接能引用的对象，速度很快。
并发标记：同时开启GC和用户线程，用一个闭包结构去记录可达对象。但在这个阶段结束，这个闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域，所以GC线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。
重新标记：重新标记阶段就是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录，这个阶段的停顿时间一般会比初始标记阶段的时间稍长，远远比并发标记阶段时间短。
并发清理：开启用户线程，同时GC线程开始对未标记的区域做清扫。
并发重置：将GC中标记状态清除。

在这里插入图片描述

从它的名字就可以看出它是一款优秀的垃圾收集器，主要优点：并发收集、低停顿。但是它有下面几个明显的缺点：

对CPU资源敏感。在并发标记和并发清除时会和程序并发执行，那么会与程序线程抢占cpu资源。
无法处理浮动垃圾。在并发清理阶段又产生垃圾，这种浮动垃圾只能等到下一次GC再清理了。
产生空间碎片。它使用的回收算法-“标记-清除”算法会导致收集结束时会有大量空间碎片产生，当然通过参数-XX:+UseCMSCompactAtFullCollection可以让JVM在执行完标记清除后再做整理。
执行过程中的不确定性。会存在上一次垃圾回收还没执行完，然后垃圾回收又被触发的况，特别是在并发标记和并发清理阶段会出现，一边回收，系统一边运行，也许没回收完就再次触发Full GC，也就是"concurrent mode failure"，此时会进入Stop-The-World，用Serial Old垃圾收集器来回收。

接下来来了解一下CMS相关的一些JVM参数。

-XX:+UseConcMarkSweepGC 启用CMS。
-XX:ConcGCThreads 并发的GC线程数。
-XX:+UseCMSCompactAtFullCollection FullGC之后做压缩整理（减少碎片）。
-XX:CMSFullGCsBeforeCompaction 多少次FullGC之后压缩一次，默认是0，代表每次 FullGC后都会压缩一次。
-XX:CMSInitiatingOccupancyFraction 当老年代使用达到该比例时会触发FullGC（默认是92，这是百分比）说明：如果只是设置这个值，那么虚拟机仅在第一次使用该设定值，后续会自动调整。如果想一直使用该阀值可配置第6项的值。
-XX:+UseCMSInitiatingOccupancyOnly 只使用设定的回收阈值(- XX:CMSInitiatingOccupancyFraction设定的值)，如果不指定，JVM仅在第一次使用设定值，后续则会自动调整
。
-XX:+CMSScavengeBeforeRemark 在CMS GC前启动一次Minor GC，目的在于减少老年代对年轻代的引用，降低CMS GC的标记阶段时的开销，一般CMS的GC耗时 80%都在remark阶段。

Garbage First（G1）垃圾收集器

G1 (Garbage-First)是一款面向服务器的垃圾收集器，主要针对配备多核处理器及大容量内存的机器，以极高概率满足GC停顿时间要求的同时,还具备高吞吐量性能特征。

G1对堆内存的划分

在这里插入图片描述
G1将Java堆划分为多个大小相等的独立区域（Region），JVM最多可以有2048个Region。一般Region大小等于堆大小除以2048，比如堆大小为4096M，则Region大小为2M，当然也可以用参数：

-XX:G1HeapRegionSize

手动指定Region大小，但是推荐默认的计算方式。
G1保留了年轻代和老年代的概念，但不再是物理隔阂了，它们都是（可以不连续）Region的集合。默认年轻代对堆内存的占比是5%，如果堆大小为4096M，那么年轻代占据200MB左右的内存，对应大概是100个Region，可以通过参数：

-XX:G1NewSizePercent

设置新生代初始占比，在系统运行中，JVM会不停的给年轻代增加更多的Region，但是最多新生代的占比不会超过60%，可以通过参数：

-XX:G1MaxNewSizePercent

调整。年轻代中的Eden和Survivor对应的Region也跟之前一样，默认8:1:1，假设年轻代现在有1000个Region，Eden区对应800个，s0对应100个，s1对应 100个。
一个Region可能之前是年轻代，如果Region进行了垃圾回收，之后可能又会变成老年代，也就是说Region的区域功能可能会动态变化。
G1垃圾收集器对于对象什么时候会转移到老年代跟之前讲过的原则一样，唯一不同的是对大对象的处理，G1有专门分配大对象的Region叫Humongous区，而不是让大对象直接进入老年代的Region中。在G1中，大对象的判定规则就是一个大对象超过了一个Region大小的50%，比如按照上面算的，每个Region是2M，只要一个大对象超过了1M，就会被放入Humongous中，而且一个大对象如果太大，可能会横跨多个Region来存放。Humongous区专门存放短期巨型对象，不用直接进老年代，可以节约老年代的空间，避免因为老年代空间不够的GC开销。 Full GC的时候除了收集年轻代和老年代之外，也会将Humongous区一并回收。

G1 垃圾收集器的收集过程

G1收集器一次GC的运作过程大致分为以下几个步骤：

初始标记（initial mark，STW）：暂停所有的其他线程，并记录下GC Roots直接能引用的对象，速度很快。
并发标记（Concurrent Marking）：同CMS的并发标记。
最终标记（Remark，STW）：同CMS的重新标记。
筛选回收（Cleanup，STW）：筛选回收阶段首先对各个Region的回收价值和成本进行排序，根据用户所期望的GC停顿时间(可以用JVM参数
-XX:MaxGCPauseMillis指定)来指定回收计划，比如说老年代此时有1000个Region都满了，但是因为根据预期停顿时间，本次垃圾回收可能只能停顿200毫秒，那么通过之前回收成本计算得知，可能回收其中800个Region刚好需要200ms，那么就只会回收800个Region，尽量把GC导致的停顿时间控制在我们指定的范围内。这个阶段其实也可以做到与用户程序一起并发执行，但是因为只回收一部分Region，时间是用户可控制的，而且停顿用户线程将大幅提高收集效率。不管是年轻代或是老年代，回收算法主要用的是复制算法，将一个Region中的存活对象复制到另一个Region中，这种不会像CMS那样回收完因为有很多内存碎片还需要整理一次，G1采用复制算法回收几乎不会有太多内存碎片。

其收集过程如下：
在这里插入图片描述

G1收集器在后台维护了一个优先列表，每次根据允许的收集时间，优先选择回收价值最大的 Region(这也就是它的名字Garbage-First的由来)，比如一个Region花200ms能回收10M圾，另外一个Region花50ms 能回收20M垃圾，在回收时间有限情况下，G1当然会优先选择后面这个 Region回收。这种使用Region划分内存空间以及有优先级的区域回收方式，保证了G1收集器在有限时间内可以尽可能高的收集效率。

GC 垃圾收集器的特征

被视为JDK1.7以上版本Java虚拟机的一个重要进化特征。它具备以下特点：

并行与并发：G1能充分利用CPU、多核环境下的硬件优势，使用多个CPU（CPU或者CPU核心）来缩短Stop-The-World停顿时间。部分其他收集器原本需要停顿Java线程来执行GC动作，G1收集器仍然可以通过并发的方式让java程序继续执行。
分代收集：虽然G1可以不需要其他收集器配合就能独立管理整个GC堆，但是还是保留了分代的概念。
空间整合：与CMS的“标记–清理”算法不同，G1从整体来看是基于“标记整理”算法实现的收集器；从局部上来看是基于“复制”算法实现的。
可预测的停顿：这是G1相对于CMS的另一个大优势，降低停顿时间是G1和 CMS 共同的关注点，但G1除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为M毫秒的时间片段(通过参数-XX:MaxGCPauseMillis指定)内完成垃圾收集。

G1垃圾收集器的垃圾收集分类

YoungGC

YoungGC并不是说现有的Eden区放满了就会马上触发，而且G1会计算下现在Eden区回收大概要多久时间，如果回收时间远远小于参数-XX:MaxGCPauseMills 设定的值，那么增加年轻代的Region，继续给新对象存放，不会马上做Young GC，直到下一次Eden区放满，G1计算回收时间接近参数 -XX:MaxGCPauseMills设定的值，那么就会触发YoungGC 。

MixedGC

不是FullGC，老年代的堆占有率达到参数(-XX:InitiatingHeapOccupancyPercen)设定的值则触发，回收所有的年轻代Region和部分老年代Region(根据期望的GC停顿时间确定old区垃圾收集的优先顺序)以及大对象区，正常情况G1的垃圾收集是先做MixedGC，主要使用复制算法，需要把各个region中存活的对象拷贝到别的Region里去，拷贝过程中如果发现没有足够的空region能够承载拷贝对象就会触发一次Full GC 。

Full GC

停止系统程序(STW)，然后采用单线程进行标记、清理和压缩整理，好空闲出来一批Region来供下一次MixedGC使用，这个过程是非常耗时的。

G1垃圾收集器常见JVM参数

-XX:+UseG1GC 使用G1收集器。
-XX:ParallelGCThreads 指定GC工作的线程数量。
-XX:G1HeapRegionSize 指定分区Region大小(1MB~32MB，且必须是2的幂)，默认将整堆划分为 2048个分区。
-XX:MaxGCPauseMillis 目标暂停时间(默认200ms) 。
-XX:G1NewSizePercent 新生代内存初始空间(默认整堆5%) 。
-XX:G1MaxNewSizePercent 新生代内存最大空间 (默认60%)。
-XX:TargetSurvivorRatio Survivor区的填充容量(默认50%)，Survivor区域里的一批对象(年龄1+年龄2+年龄n的多个年龄对象)总和超过了Survivor区域的50%，此时就会把年龄n(含)以上的对象都放入老年代。
-XX:MaxTenuringThreshold 最大年龄阈值(默认15) 。
-XX:InitiatingHeapOccupancyPercent 老年代占用空间达到整堆内存阈值(默认45%)，则执行新生代和老年代的混合收集(MixedGC)，比如我们之前说的堆默认有2048个Region，如果有接近1000个Region都是老年代的Region，则可能就要触发MixedGC了。
-XX:G1HeapWastePercent 默认5%。GC过程中空出来的Region是否充足阈值，在混合回收的时候，对Region回收都是基于复制算法进行的，都是把要回收的Region里的存活对象放入其他Region，然后这个Region中的垃圾对象全部清理掉，这样的话在回收过程就会不断空出来新的Region，一旦空闲出来的Region数量达到了堆内存的5%，此时就会立即停止混合回收，意味着本次混合回收就结束了。
-XX:G1MixedGCLiveThresholdPercent 默认85% 。Region中的存活对象低于这个值时才会回收该region，如果超过这个值，存活对象过多，回收的的意义不大。
-XX:G1MixedGCCountTarget 在一次回收过程中指定做几次筛选回收(默认8次)，在最后一个筛选回收阶段可以回收一会，然后暂停回收，恢复系统运行，一会再开始回收，这样可以让系统不至于单次停顿时间过长。

G1垃圾收集器的建议

假设参数 -XX:MaxGCPauseMills设置的值很大，导致系统运行很久，年轻代可能都占用了堆内存的60%了，此时才触发年轻代gc。那么存活下来的对象可能就会很多，此时就会导致Survivor区域放不下那么多的对象，就会进入老年代中。或者是你年轻代GC过后，存活下来的对象多，导致进入Survivor区域后触发了动态年龄判定规则，达到了Survivor区域的50%，也会快速导致一些对象进入老年代中。所以这里核心还是在于调节 -XX:MaxGCPauseMills 这个参数的值，在保证他的年轻代GC别太频繁的同时，还得考虑每次GC过后的存活对象有多少,避免存活对象太多快速进入老年代，频繁触发MixedGC。

如何选择垃圾收集器

优先调整堆的大小让服务器自己来选择。
如果内存小于100M，使用串行收集器。
如果是单核，并且没有停顿时间的要求，串行或JVM自己选择。
如果允许停顿时间超过1秒，选择并行或者JVM自己选。
如果响应时间最重要，并且不能超过1秒，使用并发收集器。

垃圾收集器的搭配选择如下：
在这里插入图片描述
但是需要注意的是在JDK1.9中CMS与Serial组合以及ParNew和Serial Old的组合已经取消了。

bingaPang

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深入JVM十：JVM中的垃圾收集器

标题Serial收集器ParNew垃圾收集器Parallel Scavenge垃圾收集器CMS垃圾收集器Garbage First（G1）垃圾收集器G1对堆内存的划分G1 垃圾收集器的收集过程GC 垃圾收集器的特征G1垃圾收集器的垃圾收集分类G1垃圾收集器常见JVM参数G1垃圾收集器的建议如何选择垃圾收集器如果说垃圾收集算法是垃圾收集的理论的话，那么垃圾收集器就是垃圾收集理论的实现，接下来来分别了解Serial、ParNew、Parallel Scavenge、CMS、G1等垃圾收集器。Serial收集
复制链接

扫一扫