之前就说,想在专栏中总结一下GC调优的相关思路和解决措施,但是准备在此篇专栏中对于GC有一个入门的概念,在明天的专栏中更进一步的去写GC调优的核心思路。
Java的垃圾收集器机制是java的招牌能力,并且目前也在不断的演进,极大地提升了开发效率,专栏尽量会将面试的重点总结起来。
那么,问题就是,java 的垃圾收集器,常见的都有哪几种?
概述
实际上,gc是与jvm紧密相关的,不同厂商IBM Oracle,不同版本的jvm,提供的选择也不一样。接下来,主要会说一下主流的oracle jdk的垃圾收集机制。
- Serial GC。
它是最古老的的垃圾收集器,其手机工作是单线程的,并且在进行垃圾收集的过程中,会进入臭名昭著的Stop The World状态。
当然,其单线程设计也意味着最精简的GC实现,无需维护复杂的数据结构,初始化也简单,所以一直是c端的jvm默认选项。
其主要采用的算法是标记-整理(Mark-Compact)算法,区别于新生代的复制算法 。
Serial GC的对应jvm参数是:
-Xx:+UseSerialGC
- ParNew GC
新生代GC,在Serial GC的基础上进行了多线程的扩展,其对应参数是:
-XX:+UseConcMarkSweepGC -XX:+UseParNewGC
- CMS (Concurrent Mark Sleep) GC
基于标记清除(mark-Sleep)算法,设计目标是尽量减少停顿时间,这一点对于web等反应时间敏感的应用非常重要,一直到今天,仍然会有很多人用CMS GC。但是存在着内存碎片化的问题,所以难以避免发生full GC ,导致恶劣的停顿。另外,既然使用到了并发,CMS就会占用更多的CPU资源,和用户端线程争抢。
- Parrallel GC
在jdk8中,它是server模式下默认的gc选择。算法与serial gc类似,特点是并行进行,效果更出色。
开启选项是:
-XX:+UseParallelGC
另外,Parrallel gc引入了设置暂停时间或者吞吐量等目标,jvm会自动进行适应性调整,例如:
-XX:MaxGCPauseMillis=value’
-XX:GCTimeRatio=N // GC时间和用户时间比例 = 1 / (N+1)
- G1 GC
这是一款兼顾吞吐量和停顿时间的gc实现,是jdk9之后的默认gc。它可以设定停顿时间,将最差情况得到一定的改善。
G1吞吐量和停顿表现都非常不错,并且仍然在不断地完善,与此同时CMS已经在JDK 9中被标记为废弃(deprecated),所以G1 GC值得你深入掌握。
接下来会侧重介绍以下两点:、
- GC的算法有哪些,如何判断一个对象是否可以回收。
- GC工作流程
另外,java在最新的jdk实现中,混杂着多种的新gc,以下都会进行介绍。
扩展
- 垃圾收集的原理和基本概念
※第一,自动收集垃圾的前提是,知道什么是垃圾,然后才能释放掉。主要释放掉的为两方面,最主要的还是存储在堆上的对象实例;另外还有方法区的元数据信息,如果该类后续不再时候,就会被释放掉内存。
既然提到了对象实例的回收,那么就来说说回收的算法,主要是两种:引用计数和可达性分析
- 引用计数
顾名思义,给对象加一个引用的计数,当计数为0就回收。这是很多语言的资源回收选择,例如py,它同时支持java没有选择的引用计数和垃圾收集机制。
- 还有java选择的可达性分析。
java的各种引用的关系,十分混乱甚至会让可达性分析复杂化,这种类型通常称为追踪性垃圾收集。原理简单来说jvm会将java虚拟机栈,本地栈正在引用的对象或者常量称之为GC Roots,与其之间存在调用关系的,就是有用的,不存在调用关系的,就是没用的,没用的就回收
※第二、gc算法总体主要分为三类:
- 复制(Copy)算法。
包括前面说到的新生代gc,原理就是将还存活的对象进行复制,并且顺序存储,这样还能顺便满足内存碎片化。
这样做的缺点是:浪费内存,当维护g1 gc这种算法的时候,由于不同region之间存在一定的相互调用的关系,那么就需要维护这种关系的前提进行复制,又是一笔开销。
- 标记-清除(Mark-sleep)算法。
首先标记没用的对象,然后清除掉。
这样做的缺点是:效率低,出现内存碎片化的问题,会导致出现Full GC,造成间歇性停顿,很难受。
- 标记-整理(Mark-Compact)
在Mark-Sleep的基础上,为了避免内存碎片化,将清除掉的garbage后的对象按照顺序移动,使他们能占用连续的内存空间。
要注意,这些都是gc的基础,实际的gc算法,多用到复合并行算法
而且,在gc的过程中,对应到Eden、Survior、Tenured等区域会发生一定的变化。
一说这个,就又不得不说一下gc的流程:
- java应用不断创建出对象,分配在Eden区域,当对象占用到阈值,就会触发minor GC。在满了之后,仍然被使用的对象被jvm复制到Survivor区域,不再引用的就回收。图中标记数字1的代表,被筛选过一轮的对象,生命值原本是0,现在变成1了。
-
经过了一次的复制-回收之后,Eden就会闲下来,当第二次Eden又满了的时候,继续触发Minor GC,这时候另一个Survivor区域会变成to区域,Eden又活下来的和From区域的对象会被复制到to区域,并且存活年龄+1。
-
重复进行第二步,超越阈值的对象,晋升到老年代。阈值可以自定义。
-XX:MaxTenuringThreshold=<N>
后面就是老年代的选项了,具体取决于选择哪种gc。以下用标记-整理(Mark-Compact)举例,当老年代的无用对象被清除后,gc会对对象进行整理,以防止内存碎片化。
通常将老年代GC叫做Major GC,将整个堆的清理叫做Full GC,但是以上的举例是片面的,不同针对老年代的gc算法大不相同,还要继续去学习。例如cms,并行gc计算,就和以上完全不相同了。
接下来的专栏,会对gc调优进一步解析。