文章目录
- CMS 回收器:低延迟
- G1 回收器:区域化分代式
- G1 回收过程
- 垃圾回收器的新发展----ZGC
- 垃圾回收器总结
CMS 回收器:低延迟
在 JDK 1.5 时期,HotSpot 推出了一款在强交互应用中几乎可认为有划时代意义的垃圾收集器:CMS(Concurrent-Mark-Sweep)收集器,这款收集器是 HotSpot 虚拟机中第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程同时工作。
- CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短(低延迟)就越适合与用户交互的程序,良好的响应速度能提升用户体验。
适用场景:
- 目前很大一部分的 Java 应用集中在互联网站或者 B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS 收集器就非常符合这类应用的需求。
CMS 的垃圾收集算法采用标记-清除算法,并且也会"Stop-The-World"
CMS 老年代的收集器:
- 不幸的是,CMS 作为老年代的收集器,却无法与 JDK 1.4.0 中已经存在的新生代收集器 Parallel Scavenge 配合工作,所以在 JDK 1.5 中使用 CMS 来收集老年代的时候,新生代只能选择 ParNew 或者 Serial 收集器中的一个。
- 在 G1 出现之前,CMS 使用还是非常广泛的。一直到今天,仍然有很多系统使用 CMS GC。
CMS 垃圾回收过程:
CMS 整个过程比之前的收集器要复杂,整个过程分为4个主要阶段,即初始标记阶段、并发标记阶段、重新标记阶段和并发清除阶段。(涉及STW的阶段主要是:初始标记 和 重新标记)
1. 初始标记(Initial-Mark)阶段:
- 在这个阶段中,程序中所有的工作线程都将会因为“Stop-The-World”机制而出现短暂的暂停,这个阶段的主要任务仅仅只是标记出 GCRoots 能直接关联到的对象。一旦标记完成之后就会恢复之前被暂停的所有应用线程。由于直接关联对象比较小,所以这里的速度非常快。
2. 并发标记(Concurrent-Mark)阶段:
- 从 GC Roots 的直接关联对象开始遍历整个对象图的过程,这个过程耗时较长但是不需要停顿用户线程,可以与垃圾收集线程一起并发运行。
3. 重新标记(Remark)阶段:
- 由于在并发标记阶段中,程序的工作线程会和垃圾收集线程同时运行或者交叉运行,因此为了修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间通常会比初始标记阶段稍长一些,但也远比并发标记阶段的时间短。
4.并发清除(Concurrent-Sweep)阶段:
- 此阶段清理删除掉标记阶段判断的已经死亡的对象,释放内存空间。由于不需要移动存活对象,所以这个阶段也是可以与用户线程同时并发的
尽管 CMS 收集器采用的是并发回收(非独占式),但是在其初始化标记和再次标记这两个阶段中仍然需要执行“Stop-the-World”机制暂停程序中的工作线程,不过暂停时间并不会太长,因此可以说明目前所有的垃圾收集器都做不到完全不需要“stop-the-World”,只是尽可能地缩短暂停时间。
由于最耗费时间的并发标记与并发清除阶段都不需要暂停工作,所以整体的回收是低停顿的
CMS 当堆内存使用率达到某一阈值时,便开始进行回收
- 另外,由于在垃圾收集阶段用户线程没有中断,所以在 CMS 回收过程中,还应该确保应用程序用户线程有足够的内存可用。因此,CMS 收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,
- 而是当堆内存使用率达到某一阈值时,便开始进行回收,以确保应用程序在 CMS 工作过程中依然有足够的空间支持应用程序运行。
- 要是 CMS 运行期间预留的内存无法满足程序需要,就会出现一次“Concurrent Mode
Failure”失败,这时虚拟机将启动后备预案:临时启用 Serial Old 收集器来重新进行老年代的垃圾收集,这样停顿时间就很长了。
CMS 收集器的垃圾收集算法采用的是标记-清除算法
- CMS收集器的垃圾收集算法采用的是标记-清除算法,这意味着每次执行完内存回收后,由于被执行内存回收的无用对象所占用的内存空间极有可能是不连续的一些内存块,不可避免地将会产生一些内存碎片。
- 那么CMS 在为新对象分配内存空间时,将无法使用指针碰撞(Bump the Pointer)技术,而只能够选择空闲列表(Free List)执行内存分配。
CMS 为什么不使用标记整理(压缩)算法?
- 答案其实很简答,因为当并发清除的时候,用 Compact 整理内存的话,原来的用户线程使用的内存还怎么用呢?要保证用户线程能继续执行,前提的它运行的资源不受影响。Mark Compact 更适合“Stop The World” 这种场景下使用
CMS优缺点:
优点
- 并发收集
- 低延迟
缺点
- 会产生内存碎片,导致并发清除后,用户线程可用的空间不足。在无法分配大对象的情况下,不得不提前触发Full GC。
- CMS 收集器对 CPU 资源非常敏感。在并发阶段,它虽然不会导致用户停顿,但是会因为占用了一部分线程而导致应用程序变慢,总吞吐量会降低。
- CMS 收集器无法处理浮动垃圾。可能出现“Concurrent Mode Failure"失败而导致另一次 Full GC 的产生。在并发标记阶段由于程序的工作线程和垃圾收集线程是同时运行或者交叉运行的,那么在并发标记阶段如果产生新的垃圾对象,CMS将无法对这些垃圾对象进行标记,最终会导致这些新产生的垃圾对象没有被及时回收,从而只能在下一次执行 GC 时释放这些之前未被回收的内存空间。
CMS 收集器可以设置的参数
小结
HotSpot 有这么多的垃圾回收器,那么如果有人问,Serial GC、Parallel GC、Concurrent Mark Sweep GC 这三个 GC 有什么不同呢?
JDK 后续版本中 CMS 的变化
G1 回收器:区域化分代式
既然我们已经有了前面几个强大的 GC,为什么还要发布 Garbage First(G1)?
- 原因就在于应用程序所应对的业务越来越庞大、复杂,用户越来越多,没有 GC 就不能保证应用程序正常进行,而经常造成 STW 的 GC 又跟不上实际的需求,所以才会不断地尝试对 GC 进行优化。G1(Garbage-First)垃圾回收器是在 Java7 update 4 之后引入的一个新的垃圾回收器,是当今收集器技术发展的最前沿成果之一。
- 与此同时,为了适应现在不断扩大的内存和不断增加的处理器数量,进一步降低暂停时间(pause time),同时兼顾良好的吞吐量。
- 官方给G1设定的目标是在延迟可控的情况下获得尽可能高的吞吐量,所以才担当起“全功能收集器”的重任与期望。
为什么名字叫 Garbage First(G1) 呢?
- 因为 G1 是一个并行回收器,它把堆内存分割为很多不相关的区域(Region)(物理上不连续的)。使用不同的Region 来表示 Eden、幸存者0区,幸存者1区,老年代等。
- G1 GC 有计划地避免在整个 Java 堆中进行全区域的垃圾收集。G1 跟踪各个 Region 里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的 Region。
- 由于这种方式的侧重点在于回收垃圾最大量的区间(Region),所以我们给 G1 一个名字:垃圾优先(Garbage First)。
G1回收器适用场景:
G1(Garbage-First)是一款面向服务端应用的垃圾收集器,主要针对配备多核 CPU 及大容量内存的机器
- 以极高概率满足 GC 停顿时间
- 同时, 还兼具高吞吐量的性能特征
是 JDK 9 以后的默认垃圾回收器
- 在 JDK 1.7 版本正式启用,移除了 Experimental 的标识,是 JDK 9 以后的默认垃圾回收器,取代了 CMS 回收器以及 Parallel + Parallel Old 组合。被 Oracel 官方称为“全功能的垃圾收集器”。
- 与此同时,CMS 已经在 JDK 9 中被标记为废弃(deprecated)。在 JDK 8 中还不是默认的垃圾回收器,需要使用 -XX:+UseG1GC 来启用。
分代收集
- 从分代上看,G1 依然属于分代型垃圾回收器,它会区分年轻代和老年代,年轻代依然有 Eden 区和 Survivor区。但从堆的结构上看,它不要求整个 Eden 区、年轻代或者老年代都是连续的,也不再坚持固定大小和固定数量。
- 将堆空间分为若干个区域(Region),这些区域中包含了逻辑上的年轻代和老年代。
- 和之前的各类回收器不同,它同时兼顾年轻代和老年代。对比其他回收器,或者工作在年轻代,或者工作在老年代;
G1 所谓的分代,已经不是下面这样的了
而是这样的一个区域
空间整合
- CMS:“标记-清除”算法、内存碎片、若干次 GC 后进行一次碎片整理
G1回收器 Region 之间是复制算法,但整体上实际可看作是标记-压缩(Mark-Compact)算法
- G1 将内存划分为一个个的 Region。内存的回收是以 Region 作为基本单位的。Region 之间是复制算法,但整体上实际可看作是标记-压缩(Mark-Compact)算法,两种算法都可以避免内存碎片。
- 这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次 GC。尤其是当 Java 堆非常大的时候,G1 的优势更加明显。
可预测的停顿时间模型(即:软实时 Soft Real-Time)
这是 G1 相对于 CMS 的另一大优势,G1 除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内,消耗在垃圾收集上的时间不得超过 N 毫秒。
- 由于分区的原因,G1 可以只选取部分区域进行内存回收,这样缩小了回收的范围,因此对于全局停顿情况的发生也能得到较好的控制。
- G1 跟踪各个 Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region 。保证了 G1 收集器在有限的时间内可以获取尽可能高的收集效率。
- 相比于 CMS GC,G1 未必能做到 CMS 在最好情况下的延时停顿,但是最差情况要好很多。
G1 垃圾收集器的优点
与其他 GC 收集器相比,G1 使用了全新的分区算法,其特点如下所示:
并行与并发
- 并行性:G1 在回收期间,可以有多个 GC 线程同时工作,有效利用多核计算能力。此时用户线程 STW
- 并发性:G1 拥有与应用程序交替执行的能力,部分工作可以和应用程序同时执行,因此,一般来说,不会在整个回收阶段发生完全阻塞应用程序的情况
G1 垃圾收集器的缺点
- 相较于 CMS,G1 还不具备全方位、压倒性优势。比如在用户程序运行过程中,G1
无论是为了垃圾收集产生的内存占用(Footprint)还是程序运行时的额外执行负载(Overload)都要比 CMS 要高。 - 从经验上来说,在小内存应用上 CMS 的表现大概率会优于 G1,而 G1 在大内存应用上则发挥其优势。平衡点在6-8GB 之间。
G1 参数设置
G1 收集器的常见操作步骤
G1 的设计原则就是简化 JVM 性能调优,开发人员只需要简单的三步即可完成调优:
- 第一步:开启 G1 垃圾收集器
- 第二步:设置堆的最大内存
- 第三步:设置最大的停顿时间
G1 中提供了三种垃圾回收模式:YoungGC、Mixed GC 和Full GC,在不同的条件下被触发。
G1 收集器的适用场景
面向服务端应用,针对具有大内存、多处理器的机器。(在普通大小的堆里表现并不惊喜)
最主要的应用是需要低 GC 延迟,并具有大堆的应用程序提供解决方案;
如:在堆大小约 6GB 或更大时,可预测的暂停时间可以低于0.5秒;(G1 通过每次只清理一部分而不是全部的Region 的增量式清理来保证每次 GC 停顿时间不会过长)。 用来替换掉 JDK 1.5 中的 CMS 收集器;
在下面的情况时,使用 G1 可能比 CMS 好:
- 超过50%的 Java 堆被活动数据占用;
- 对象分配频率或年代提升频率变化很大;
- GC 停顿时间过长(长于0.5至1秒)
HotSpot 垃圾收集器里,除了 G1 以外,其他的垃圾收集器使用内置的 JVM 线程执行 GC 的多线程操作,而 G1 GC 可以采用应用线程承担后台运行的 GC 工作,即当 JVM 的 GC 线程处理速度慢时,系统会调用应用程序线程帮助加速垃圾回收过程。
分区 Region:化整为零
- 使用 G1 收集器时,它将整个 Java 堆划分成约2048个大小相同的独立 Region 块,每个 Region块大小根据堆空间的实际大小而定,整体被控制在 1MB 到 32MB之间,且为2的N次幂,即1MB,2MB,4MB,8MB,16MB,32MB。可以通过 -XX:G1HeapRegionSize设定。所有的 Region 大小相同,且在 JVM 生命周期内不会被改变。
- 虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分 Region(不需要连续)的集合。通过 Region的动态分配方式实现逻辑上的连续。
- 一个 Region 有可能属于 Eden,Survivor 或者 Old/Tenured 内存区域。但是一个 Region 只可能属于一个角色。图中的 E 表示该 Region 属于 Eden 内存区域,S 表示属于 Survivor 内存区域,O 表示属于 Old 内存区域。图中空白的表示未使用的内存空间。
Humongous 内存区域
- G1 垃圾收集器还增加了一种新的内存区域,叫做 Humongous 内存区域,如图中的 H 块。主要用于存储大对象,如果超过 1.5 个 Region,就放到 H。
- 设置H的原因:对于堆中的对象,默认直接会被分配到老年代,但是如果它是一个短期存在的大对象就会对垃圾收集器造成负面影响。为了解决这个问题,G1划分了一个 Humongous 区,它用来专门存放大对象。如果一个H 区装不下一个大对象,那么 G1 会寻找连续的 H区来存储。为了能找到连续的 H 区,有时候不得不启动Full GC。G1 的大多数行为都把 H 区作为老年代的一部分来看待。
每个 Region 都是通过指针碰撞来分配空间
G1 垃圾回收器的回收过程
G1 GC 的垃圾回收过程主要包括如下三个环节:
- 年轻代 GC(Young GC)
- 老年代并发标记过程(Concurrent Marking)
- 混合回收(Mixed GC)
(如果需要,单线程、独占式、高强度的 Full GC 还是继续存在的。它针对 GC 的评估失败提供了一种失败保护机制,即强力回收。)
顺时针,Young GC -> Young GC + Concurrent Mark -> Mixed GC 顺序,进行垃圾回收。
举个例子:一个 Web 服务器,Java 进程最大堆内存为4G,每分钟响应1500个请求,每45秒钟会新分配大约2G的内存。G1 会每45秒钟进行一次年轻代回收,每31个小时整个堆的使用率会达到45%,会开始老年代并发标记过程,标记完成后开始四到五次的混合回收。
Card Table
- 由于做YGC时,需要扫描整个OLD区,效率非常低
- 所以JVM设计了CardTable,
如果一个OLD区CardTable中有对象指向Y区,就将它设为Dirty,下次扫描时,只需要扫描Dirty Card 在结构上,Card - Table用BitMap来实现
Remembered Set(记忆集)
一个对象被不同区域引用的问题
一个 Region 不可能是孤立的,一个 Region 中的对象可能被其他任意 Region 中对象引用,判断对象存活时,是否需要扫描整个 Java 堆才能保证准确?
在其他的分代收集器,也存在这样的问题(而 G1 更突出)回收新生代也不得不同时扫描老年代?这样的话会降低 Minor GC 的效率;
解决方法:---- Remembered Set
无论 G1 还是其他分代收集器,JVM 都是使用 Remembered Set 来避免全局扫描:
- 每个 Region 都有一个对应的 Remembered Set ;每次 Reference 类型数据写操作时,都会产生一个 WriteBarrier 暂时中断操作;
- 然后检查将要写入的引用指向的对象是否和该 Reference 类型数据在不同的
Region(其他收集器:检查老年代对象是否引用了新生代对象);如果不同,通过 CardTable 把相关引用信息记录到引用指向对象的所在Region对应的 Remembered Set 中;当进行垃圾收集时,在 GC 根节点的枚举范围加入 Remembered Set;就可以保证不进行全局扫描,也不会有遗漏。
G1 回收过程
G1 回收过程一:年轻代 GC
G1 回收过程二:并发标记过程(主要针对老年代)
G1 回收过程三:混合回收
G1 回收可选的过程四:Full GC
导致G1 Full GC 的原因
G1 回收的优化建议
年轻代大小
- 避免使用 -Xmn 或 -XX:NewRatio 等相关选项显式设置年轻代大小
- 固定年轻代的大小会覆盖暂停时间目标
暂停时间目标暂停时间目标不要太过严苛
- G1 GC 的吞吐量目标是90%的应用程序时间和10%的垃圾回收时间
- 评估 G1 GC 的吞吐量时,暂停时间目标不要太严苛。目标太过严苛表示你愿意承受更多的垃圾回收开销,而这些会直接影响到吞吐量。
垃圾回收器的新发展----ZGC
Open JDK 12 的 Shenandoash GC
革命性的 ZGC
- 在 ZGC 的强项停顿时间测试上,塔毫不留情的将 Parallel、G1拉开了两个数量级的差距。无论平均挺对、95%停顿、99%停顿、99.9%停顿,还是最大停顿时间,ZGC 都能毫不费劲控制在10毫秒以内。
其他垃圾回收器
垃圾回收器总结
截止 JDK 1.8,一共有7款不同的垃圾收集器。每一款的垃圾收集器都有不同的特点,在具体使用的时候,需要根据具体的情况选用不同的垃圾收集器。
GC 发展阶段:Serial => Parallel(并行)=> CMS(并发)=> G1 => ZGC
不同厂商、不同版本的虚拟机实现差距比较大。HotSpot 虚拟机在 JDK7/8 后所有收集器及组合如下图
怎么选择垃圾回收器
Java 垃圾收集器的配置对于 JVM 优化来说是一个很重要的选择,选择合适的垃圾收集器可以让 JVM 的性能有一个很大的提升。怎么选择垃圾收集器?
- 优先调整堆的大小让 JVM 自适应完成。
- 如果内存小于100M,使用串行收集器
- 如果是单核、单机程序,并且没有停顿时间的要求,串行收集器
- 如果是多 CPU、需要高吞吐量、允许停顿时间超过1秒,选择并行或者 JVM 自己选择
- 如果是多 CPU、追求低停顿时间,需快速响应(比如延迟不能超过1秒,如互联网应用),使用并发收集器
- 官方推荐 G1,性能高。现在互联网的项目,基本都是使用 G1。
最后需要明确一个观点:
没有最好的收集器,更没有万能的收集
调优永远是针对特定场景、特定需求,不存在一劳永逸的收集器
三色标记
- CMS回收器
- G1回收器
漏标
- CMS用增量更新
- G1用SATB