因为最近在项目中排查内存溢出的问题,所以特意回顾整理了一下GC的相关知识,发现网上的文章对于GC的触发条件与区别都各有不同,容易混淆。特此mark一下。
这里回顾一下jvm的分代回收。JVM将堆空间(heap)划分为eden区,s0(survivor0),s1(survivor1),old区,metaspace(永久代jdk1.8),其中eden,s0,s1统称young gen(年轻代)
以下只讨论hotspot VM的实现,
JDK1.8默认使用的ParallelGC(Parallel Scavenge),年轻代GC的触发条件是 Eden区达到阀值,young gc触发时将同时对eden和S区进行清理,eden区未被清理的部分对象转移到S区,eden区清空,且计数+1。S区中未被清理的对象也计数+1,同时复制转移到另一个S区,本S区清空(因为要保持S0或S1其中一个区域为空)。当S区中的某一个对象的计数达到阀值,则晋升至old gen。该阀值通过-XX MaxTenuringThreshold来设置
而old gen的GC会稍微复杂一点。首先我们需要弄清楚old gc也就是major gc和full gc的关系。
具体点说其实如上图所示,major gc其实并不等于full gc。full gc的定义是对young gen,old gen以及metaspace(永久代)的全局范围的一次gc。而major gc只针对于old gen。但为什么外界大部分都会将major gc和full gc混为一谈呢。大抵是因为hotspot vm所实现的几种GC算法组合中,大部分触发major gc的同时也会带有full gc。所以讨论old gen的gc,需要结合具体的算法组合来看。
以下列出老生常谈的hotspot vm的几种GC算法,具体算法我就只提个名字,有兴趣可以百度(我就不在这里写小小说了)
Serial GC:串行回收,算法采用复制清除算法。使用Serial Young GC + Serial Old GC,这个是full gc
Parallel GC:jdk1.8的默认gc器,年轻代都使用Parallel Young GC,而老年代则有两种一种是非并行的PS MarkSweep GC(使用标记清除算法),另一种是并行的Parallel Old GC(使用标记整理算法),通过UseParallelOldGC参数来控制,不加这个参数默认使用非并行的那种。区别就在于Parallel Old GC是并行的,且算法步骤中多了整理的这一步。但他们其实都是full gc,只是在执行old gc的时候会先执行一次young gen 的gc,以减轻full gc的压力
CMS GC:ParNew GC对应年轻代的gc, CMS GC对应old的gc,采用的是并发标记清除算法。要讲清楚CMS的老年代gc可能会比较复杂。但我们要清楚,CMS的重点是并发,降低gc时间,也就是说他是并发gc,以期将GC造成stop the world的时候对用户的影响降到最小。大致来讲,cms gc分为几个阶段,第一个是预标记阶段,这个阶段会触发stw,同时标记gc root对象下一可达对象(只是下一个可达对象,只有一层)。第二个是并发标记阶段,此时不会暂停用户线程,将从上一阶段标记的对象开始进行可达性分析,标记所有可达对象。第三阶段是remark重标记阶段,由于我们在第二阶段标记时用户线程依然在跑,所以会有一些标记对象的引用可能发生改变,所以这个阶段会触发stw,标记引用发生改变的对象,以及新分配到老年代的对象(因为上一阶段也可能发生年轻代晋升)。可以看到cms为了降低stw的时间做了很多努力,所有涉及stw的阶段工作量都不会很多。
最后就是清理阶段,这个时候会恢复用户线程,同时清理那些未标记对象。 这里提一点比较重要的,在进行重标记阶段的gc root可达性分析时,需要同时扫描年轻代(如上图所示,因为可能存在年轻代对老年代对象的引用),但是这就会涉及全量扫描年轻代和老年代,这对于看重gc时间的cms来说是不能忍的。所以该怎么办?在全量扫描年轻代之前进行一次young gc不就行了。所以这么总的来说,CMS GC虽然是针对old gen的gc,但他也触发了young gc。所以也勉强算是full gc。
G1 GC:young gc和mixed gc,G1 GC中除了分代的概念之外,还有分区的概念,所以针对old gen所使用的mixed gc,不会全量回收,而是只针对部分区域进行回收。这部分区域的决定会有许多控制参数参与,这里我不做详细讨论。但G1也有full gc,当mixed gc之后依然空间不足或无法未巨型对象分配连续空间时,就会来一次full gc。这个full gc使用的是串行的Serial gc,所以相当耗时。
小学生作文,如有错误欢迎指出。