Java虚拟机的垃圾回收器介绍

最新推荐文章于 2023-01-10 09:21:18 发布

Juno99

最新推荐文章于 2023-01-10 09:21:18 发布

阅读量447

点赞数 1

分类专栏： Java底层原理文章标签： jvm java 面试

本文链接：https://blog.csdn.net/Jhno99/article/details/107547586

版权

Java底层原理专栏收录该内容

21 篇文章 40 订阅

订阅专栏

一、GC分类与性能指标

吞吐量：运行用户代码的时间占总运行的比例（程序运行时间/(程序运行时间+内存回收时间)）。
垃圾收集开销：吞吐量的补数，垃圾收集所用时间与总运行时间的比例。
暂停时间：执行垃圾收集时，程序的工作线程被暂停的时间。
收集效率：相对于应用程序的执行，收集操作发生的频率。
内存占用：Java堆区所占的内存大小。
快速：一个对象从诞生到被回收所经历的时间。

吞吐量

吞吐量就是CPU用于运行用户代码时间与CPU总消耗时间的比值，即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)。

暂停时间

指一个时间段内应用程序线程暂停，让GC线程执行的状态。

对比来看

高吞吐量较好因为这会让应用程序的最终用户感觉只有应用程序线程在做“生产性”工作。直觉上，吞吐量越高程序运行越快。
低暂停时间（低延迟）较好因为从最终用户的角度来看不管是GC还是其它原因导致一个应用程序被挂起始终是不好的。这取决于应用程序的类型，有时候甚至短暂的200毫秒暂停都可能打断终端用户体验。因此，具有低的较大暂停时间是非常重要的，特别是对于一个交互式应用程序。
但是，“高吞吐量”和“低延迟”是一对相互竞争的目标。如果选择吞吐量优先，那么必然需要降低内存回收的执行频率，但是这样会导致GC需要更长的单次暂停时间来执行内存回收。相反地，如果选择低延迟优先，那么为了降低每次执行内存回收时暂停时间，也只能频繁地执行内存回收，但这又引起了年轻代内存的所见和导致程序吞吐量的下降。

现在GC算法设计标准：在最大吞吐量优先的情况下，降低停顿时间。

二、不同的垃圾回收器概述

垃圾收集器的组合关系

上图组合线解释

为什么要有这么多的收集器？

因为Java的使用场景很多，移动端，服务端等。所以就需要针对不同的场景，提供不同的垃圾收集器，提高垃圾收集的性能。

虽然我们会对各个收集器进行比较，但并非为了挑选一个最好的收集器出来，我们选择的只是对应具体应用最合适的收集器。

查看默认的垃圾收集器指令

-XX：+PrintCommandLineFlags:查看命令行相关参数（包含使用的垃圾收集器）

使用命令行指令：jinfo -flag 相关垃圾回收器参数进程ID

三、Serial回收器：串行回收

Serial收集器时HotSpot中Client模式下的默认新生代垃圾收集器。

Serial收集器采用复制算法、串行回收和“stop-the-world”机制的方式执行回收内存。

除了年轻代之外，Serial收集器还提供用于执行老年代垃圾收集的Serial Old收集器。Serial Old收集器同样也采用了串行回收和“stop-the-world”机制，只不过内存回收算法使用的是标记-压缩算法。

Serial Old是运行在Client模式下默认的老年代的垃圾回收器

Serial Old在Server模式下主要有两个用途：①与新生代的Parallel Scavenge配合使用②作为老年代CMS收集器的后备垃圾收集方案。

Serial垃圾回收器的优势

四、ParNew回收器：并行回收

如果说Serial GC是年轻代中的单线程垃圾收集器，那么ParNew收集器则是Serial收集器的多线程版本。

Par（Parallel缩写）New（只能处理新生代）

由于ParNew收集器时基于并行回收，那么是否可以断定ParNew收集器的回收效率在任何场景下都会比Serial收集器更高效？

ParNew收集器运行在多CPU环境下，由于可以充分利用多CPU、多核心等物理硬件资源优势，可以更快地完成垃圾收集，提升程序的吞吐量。
但是在单个CPU环境下，ParNew收集器不比Serial收集器更高效。虽然Serial收集器时基于串行回收的，但是由于CPU不需要频繁地做任务切换，因此可以有效避免多线程交互过程中产生的一些额外开销。

除了Serial外，目前只有ParNewGC能与CMS收集器配合工作。

程序中可以通过选项“+XX:+UseParNewGC”手动指定使用ParNew收集器执行内存回收任务。它表示年轻代使用并行收集器，不影响老年代。

-XX:ParallelGCThreads限制线程数量，默认开启和CPU数据相同的线程数。

五、Parallel Scavenge回收器：吞吐量优先

HotSpot的年轻代中除了拥有ParNew收集器是基于并行回收的意外，Parallel Scavenge收集器同样也采用了复制算法、并行回收和“Stop the World”机制。

那么Parallel收集器是否多此一举呢？

和Parallel收集器不同，Parallel Scavenge收集器的目标则是达到一个可控制的吞吐量，它也被成为吞吐量优先的垃圾收集器。
自适应调节策略也是Parallel Scavenge与ParNew一个重要区别。

Parallel Scavenge + Parallel Old收集器是JDK8的默认垃圾收集器。

参数配置

六、CMS回收器：低延迟

但是，在JDK1.5中使用CMS来收集老年代的时候，新生代只能选择ParNew或者Serial收集器中的一个。

在G1出现之前，CMS使用还是非常广泛的。一直带今天，仍然有很多系统使用CMS GC

工作原理

CMS工作的整个过程分为4个主要阶段，即初始标记阶段、并发标记阶段、重新标记阶段和并发清除阶段。

初始标记阶段：在这个阶段中，程序中所有的工作线程都将会因为“Stop-the-world”机制而出现短暂的暂停，这个阶段的主要任务仅仅只是标记出GC Roots能直接关联到的对象。一旦标记完成之后就会恢复之前被暂停的所有应用线程由于直接关联对象比较少，所以这里的速度非常快。（STW）
并发标记阶段：从GC Roots的直接关联对象开始遍历整个对象图的过程，这个过程耗时较长但是不需要停顿用户线程，可以与垃圾收集线程一起并发运行。
重新标记阶段：由于在并发标记阶段中，程序的工作线程会和垃圾收集线程同时运行或者交叉运行，因此为修正并发标记期间，因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录，相当于再次确认一下是不是垃圾对象，这个阶段的停顿时间通常会比初始阶段稍长一些，但是也远比并发标记阶段的时间短。（更多的是对那些重新被引用的对象取消标记）（STW）
并发清除阶段：此阶段清理删除掉标记阶段的已经死亡的对象，释放内存空间。由于不需要移动存活对象，所以这个阶段也是可以与用户线程并发的。

CMS收集器的垃圾收集算法采用的是标记-清除算法，这意味着每次执行完内存回收后，由于被执行内存回收的无用对象所占用的内存空间极有可能是不连续的一些内存块，不可避免地会产生一些内存碎片。那么CMS在为新对象分配内存空间时，将无法使用指针碰撞技术，而只能够选择空闲列表执行内存分配。

既然标记-清除算法会造成内存碎片，那么为什么不把算法换成标记-压缩算法呢？

答：因为当并发清除的时候，用compact整理内存的话，原来的用户线程使用的内存就无法使用了，要保证用户线程能继续执行，前提是它运行的资源不受影响，并发执行情况下，标记-压缩在压缩的过程中可能会对运行资源造成干扰。

CMS优点

并发收集
低延迟

CMS弊端

会产生内存碎片，导致并发清除后，用户线程可用的空间不足。在无法分配大对象的情况下，不得不提前触发Full GC。
CMS收集器对CPU资源非常敏感。在并发阶段，它虽然不会导致用户停顿，但是会因为占用率一部分线程而导致应用程序变慢，总吞吐量会降低。
CMS收集器无法处理浮动垃圾。可能出现“Concurrent Mode Failure”失败而导致另一次Full GC的产生。

参数设置

小结

HotSpot有那么多的垃圾回收器，那么Serial GC、Parallel GC、Concurrent Mark Sweep GC 这三个GC有什么不同呢？

如果想要最小化地使用内存和并行开销，请选用Serial GC；

如果想要最大化应用程序的吞吐量，请选用Parallel GC；

如果想要最小化GC的中断或停顿时间，请选用CMS GC；

JDK后续版本中CMS的变化

七、G1回收器：区域化分代式

官方给G1设定的目标是在延迟可控的情况下获得尽可能高的吞吐量，所以才担当起“全功能收集器”的重任与期望。

为什么名字叫做Garbage First（G1）呢？

G1 GC有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小（回收所获得的空间大小以及回收所需时间的经验值），在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的Region。

由于这种方式的侧重点在于回收垃圾最大量的区间，所以起名为：垃圾优先（Garbage First）。

特点：

1.并行与并发

并行性：G1在回收期间，可以有多个GC线程同时工作，有效利用多核计算能力。此时用户线程STW。
并发性：G1拥有与应用程序交替执行的能力，部分工作可以和应用程序同时执行，因此，一般来说，不会在整个回收阶段发生完全阻塞应用程序的情况。

2.分代收集

从分代上看，G1 依然属于分代型垃圾回收器，它会区分年轻代和老年代，年轻代依然有Eden区和Survivor区。但从堆的结构上看，它不要求整个Eden区、年轻代或者老年代都是连续的，也不再坚持固定大小和固定数。
将堆空间分为若干个区域（Region），这些区域中包含了逻辑上的年轻代和老年代。
和之前的各类回收器不同，它同时兼顾年轻代和老年代。对比其他回收器，或者工作在年轻代，或者工作在老年代。

3.空间整合

CMS：“标记-清除”算法、内存碎片、若干次GC后进行一次碎片整理
G1将内存划分为一个个的region。内存的回收是以region作为基本单位的。Region之间是复制算法，但整体上实际可看做是标记-压缩算法，两种算法都可以避免内存碎片。这种特性有利于程序长时间运行，分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。尤其是当Java堆非常大的时候，G1的优势更加明显。

4.可预测的停顿时间模型（即：软实时soft real-time）

这是G1相对于CMS的另一大优势，G1除了追求低停顿外，还能建立可预测的停顿时间模型，能让使用者明确指定在一个长度为M毫秒的时间片段内，消耗在垃圾收集上的时间不得超过N毫秒。

由于分区的原因，G1可以只选取部分区域进行内存回收，这样缩小了回收的范围，因此对于全局停顿情况的发生也能得到较好的控制。
G1跟踪各个Region里面的垃圾堆积的价值大小（回收所获得的的空间大小以及回收所需时间的经验值），在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的Region。保证了G1收集器在有限的时间内可以获取尽可能高的手机效率。
相比于CMS GC，G1未必能够做到CMS在最好情况下的延时停顿，但是最差情况要好很多。

参数设置

操作步骤

第一步：开启G1垃圾收集器（JDK8及以前加运行参数-XX:+UseG1GC）
第二步：设置堆的最大内存（-Xmx 、-Xms）
第三步：设置最大的停顿时间(-XX :MaxGCPauseMillis)

G1提供了三种垃圾回收模式：YoungGC、Mixed GC和Full GC，在不同的条件下被触发。

使用场景

分区Region：化整为零

一个Region有可能属于Eden、Survivor或者Old/Tenured内存区域，但是一个region只可能属于一个角色。途中E表示该region属于Eden内存区域，S表示属于Survivor内存区域，空白表示未使用的内存空间。
G1垃圾收集器还增加了一种新的内存区域，叫做Humongous内存区域，如图中的H块，主要用于存储大对象，如果超过1.5个region，就放到H。

设置H的原因

G1回收器垃圾回收过程

G1 GC的垃圾回收过程主要包括如下三个环节

年轻代GC（Young GC）
老年代并发标记过程（Concurrent Marking）
混合回收（Mixed GC）
如果需要，单线程、独占式、高强度的Full GC还是继续存在的。它针对GC的评估失败提供了一种失败保护机制，即强力回收。

应用程序分配内存，当年轻代的Eden区用尽时开始年轻代回收过程；G1的年轻代收集阶段是一个并行（即，多个垃圾回收线程）的独占式（STW）的收集器。在年轻代回收期，G1 GC暂停所有应用程序线程，启动多线程执行年轻代回收。然后从年轻代区间移动存活对象到Survivor区间或者老年区间，也有可能是两个区间都会涉及。

当堆内存达到一定值（默认45%）时，开始老年代并发标记过程。

G1回收器垃圾回收过程：RememberedSet（记忆集）

产生原因：

解决方法：

无论G1还是其他分代收集器，JVM都是使用Remembered Set来避免全局扫描；
每个Region都有一个对应的Remembered Set；
每次Reference类型数据写操作时，都会产生一个Write Barrier暂时中断操作；
然后检查将要写入的引用指向的对象是否和该Reference类型数据在不同Region（其他收集器：检查老年代对象是否引用了新生代对象）；
如果不同，通过CardTable把相关的引用信息记录到引用对象的所在Region对应的Remembered Set中；
当进行垃圾收集时，在GC根节点的枚举范围加入Remembered Set：就可以保证不进行全局扫描，也不会遗漏。

G1 GC回收过程一：年轻代GC

G1 GC回收过程二：并发标记过程

G1 GC回收过程三：混合回收

混合回收的相关细节

G1 GC回收可选过程四：Full GC

G1的初衷就是要避免Full GC的出现。但是如果上述方式不能正常工作，G1会停止应用程序的执行（STW），使用单线程的内存回收算法进行垃圾回收，性能会非常差，应用程序停顿时间会很长。

要避免Full GC的发生，一旦发生需要进行调整。什么时候会发生Full GC呢？比如堆内存太小，当G1在复制存活对象的时候没有空的内存分段可用，则会回退到Full GC，这种情况可以通过增大内存解决。

导致G1 Full GC 的原因可能有两个：

Evacution的时候没有足够的to-space来存放晋升的对象；
并发处理过程完成之前空间耗尽。

G1 GC优化建议

1、年轻代大小

避免使用-Xmn或-XX:NewRatio等相关选项显式设置年轻代大小
固定年轻代的大小会覆盖暂停时间目标

2、暂停时间目标不要太过严苛

G1 GC的吞吐量目标是90%的应用程序时间和10%的垃圾回收时间。
评估G1 GC的吞吐量时，暂停时间目标不要太严苛。目标太过严苛表示你愿意承受更多的垃圾回收开销，而这些会直接影响到吞吐量。

八、垃圾回收器总结

截止到JDK1.8，一共有7款不同的垃圾收集器。每一款不同的垃圾收集器都有不同的特点，在具体使用的时候，需要根据具体的情况选用不同的垃圾回收器。

如何选择垃圾回收器？

Java垃圾收集器的配置对JVM优化来说是一个很重要的选择，选择合适的垃圾收集器可以让JVM的性能有一个很大的提升。

怎样选择合适的垃圾收集器呢？

优先调整堆的大小让JVM自适应完成。
如果内存小于100M，使用串行收集器
如果是单核、单机程序，并且没有停顿时间的要求，串行收集器。
如果是多CPU、需要高吞吐量、允许停顿时间超过1秒，选择并行或者JVM自己选择。
如果是多CPU、追求低停顿时间，需要快速响应（比如延迟不能超过1秒，如互联网应用），使用并发收集器。官方推荐G1，性能高，现在互联网项目基本都是使用G1。

九、GC日志分析

十、垃圾回收器的新发展

再说。

Juno99

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Java虚拟机的垃圾回收器介绍

一、GC分类与性能指标二、不同的垃圾回收器概述三、Serial回收器：串行回收四、ParNew回收器：并行回收五、Parallel回收器：吞吐量优先六、CMS回收器：低延迟七、G1回收器：区域化分代式八、垃圾回收器总结九、GC日志分析十、垃圾回收器的新发展...
复制链接

扫一扫