本文主要总结自JavaGuide哥的文章guide哥文章在线地址。有兴趣可以关注guide哥的公众号
上一篇讲了JVM的基础,这一篇主要讲JVM的垃圾回收机制,涵盖垃圾回收算法和垃圾收集器。
JVM垃圾回收基础
程序计数器、虚拟机栈、本地方法栈随线程而生,也随线程而灭;栈帧随着方法的开始而入栈,随着方法的结束而出栈。这几个区域的内存分配和回收都具有确定性,在这几个区域内不需要过多考虑回收的问题,因为方法结束或者线程结束时,内存自然就跟随着回收了。
而对于 Java 堆和方法区,我们只有在程序运行期间才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的正是这部分内存。
Java堆是垃圾回收的主要内存区域,因此也被叫做GC堆(Garbage Collected Heap)
堆空间的基本结构:
新生代:新生代进一步划分为:Eden、From Survivor0、To Survivor1 三个分区。新生代主要存储频繁创建销毁的对象。
老年代:存储一些经常使用到的对象以及比较大的对象。
在执行一次新生代垃圾(Minor GC)回收时涉及到的内存区域改变:如果对象还存活(Eden和Survivor0的对象)则会进入To Survivor1 区。移动对象之前,Survivor1区是没有存储对象的,移动之后Eden和Survivor0上的对象全部转移的Survivor1中,而Survivor0上对象被清空。此时交换Survivor1和Survivor0的角色:现在为空的Survivor0作为Survivor1,存储对象的Survivor1作为Survivor0。
对象移动到Survivor1后将对象的年龄+1,当对象的年龄大于15(默认是15,可以修改)后,对象将进入老年代。对象晋升到老年代的年龄阈值可以通过参修改
-XX:MaxTenuringThreshold
注: Hotspot遍历所有对象时,按照年龄从小到大对其所占用的大小进行累积,当累积的某个年龄大小超过了survivor区的一半时,取这个年龄和MaxTenuringThreshold中更小的一个值,作为新的晋升年龄阈值”
- 大多数情况下对象在新生代Eden去分配,当Eden去没有足够的空间时会进行一次Minor GC。Minor GC非常频繁,回收速度也快。
- 大对象就是需要大量连续内存空间的对象(比如:字符串、数组)。为了避免为大对象分配内存时由于分配担保机制带来的复制而降低效率。
- 长期存活的对象将进入老年代。Minor GC后还存活的对象,它的年龄+1,当年龄大于XX:MaxTenuringThreshold时,对象进入老年代。
如何判断一个对象该不该回收
- 引用计数法:每个对象对应一个计数器,当有一个对象引用它的时候计数器+1,引用结束、失效时计数器-1.当计数器为0时说明这个对象当前没有被引用,宣判对象死亡。缺点:无法解决循环引用的问题。比如
objA.instance = objB;
objB.instance = objA;
Object A 和 B 之间循环引用,此时双方的计数器都是1,但是没有其他地方引用到。
2. 可达性分析算法:以一系列GC Roots 对象为起点开始向下搜索,向下搜索过程形成一条对象引用链,当一个对象没有在任何一个GC Roots 引用链上时,说明这个对象当前没有被引用。可以作为GC Roots 的有:
垃圾回收算法
垃圾收集方法主要有:标记-清除算法、复制法、标记-整理法、分代收集算法
标记-清除算法:从名字就可以看出这个算法分两步走:先标记出所有要清除的对象,再对这些对象进行清除。
缺点:效率较低;容易产生大量不连续的空间。
复制法:将内存分为两块,每次都将存活的对象复制到另一块内存中,然后将这一整块区域的数据清空。
优点:相比于标记-清除法效率更高。
缺点:很明显这个方法需要将内存分为两份。
标记-整理法:第一步与标记-清除法一样,先对对象进行标记,只是不进行清理,而是将对象往一段移动,最后直接清理掉边界意外的内存。
分代收集算法:当前虚拟机大多采取分代收集算法,也就是上面提到的新生代、老年代,新生代又细分为 Eden、From Survivor0、To Survivor1等区域。使用复制法,将留下来的对象复制到 Survivor1区域中,然后清空 Eden和Survivor0区域。
垃圾收集器
垃圾回收算法是理论,要将其应用到实际的垃圾回收器中国。
Serial收集器:最古老的垃圾回收器,单线程,进行垃圾回收时会暂停所有工作线程“Stop the World”,直到它收集结束。
新生代采用复制法,老年代采用的是标记-清除法。
缺点:stop the world停止了所有的工作线程,带来了不好的用户体验
优点:单线程效率更高,简单高效,没有上下文的切换。
ParNew收集器: Serial收集器的多线程版本,其余和Serial收集器一样。
Parallel Scavenge 收集器:也是使用复制算法的多线程收集器,看上去和ParNew一样。不同之处在于Parallel Scavenge 收集器的关注点四号吞吐量(高效率利用CPU),它提供多个参数供用户找到最合适的停顿时间或最大吞吐量。
新生代使用复制法,老年代使用标记-整理法
Serial Old 收集器:
Parallel Old 收集器:
CMS 收集器(Concurrent Mask Sweep):用户体验至上,以获取最短回收停顿时间为目标的收集器,停顿时间越短,用户体验越好。
CMS收集器是标记-清除法的实现,主要分为四个步骤:
- 初始标记: 暂停所有的其他线程,并记录下直接与 root 相连的对象,只是做标记,所以速度很快 ;
- 并发标记: 同时开启 GC 和用户线程,用一个闭包结构去记录可达对象。但在这个阶段结束,这个闭包结构并不能保证包含当前所有的可达对象。因为用户线程可能会不断的更新引用域,所以 GC 线程无法保证可达性分析的实时性。所以这个算法里会跟踪记录这些发生引用更新的地方。
- 重新标记: 重新标记阶段就是为了修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段的时间稍长,远远比并发标记阶段时间短
- 并发清除: 开启用户线程,同时 GC 线程开始对未标记的区域做清扫。
优点:并发收集、低停顿、用户体验好。
缺点:对CPU资源敏感;无法处理浮动垃圾;使用标记-清除法将导致堆中产生大量碎片空间。
G1 收集器:
G1 (Garbage-First) 是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足 GC 停顿时间要求的同时,还具备高吞吐量性能特征.=.
并行与并发:G1 能充分利用 CPU、多核环境下的硬件优势,使用多个 CPU(CPU 或者 CPU 核心)来缩短 Stop-The-World 停顿时间。部分其他收集器原本需要停顿 Java 线程执行的 GC 动作,G1 收集器仍然可以通过并发的方式让 java 程序继续执行。
分代收集:虽然 G1 可以不需要其他收集器配合就能独立管理整个 GC 堆,但是还是保留了分代的概念。
空间整合:与 CMS 的“标记–清理”算法不同,G1 从整体来看是基于“标记整理”算法实现的收集器;从局部上来看是基于“复制”算法实现的。
可预测的停顿:这是 G1 相对于 CMS 的另一个大优势,降低停顿时间是 G1 和 CMS 共同的关注点,但 G1 除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为 M 毫秒的时间片段内。
G1 收集器的运作大致分为以下几个步骤:
初始标记
并发标记
最终标记
筛选回收
G1 收集器在后台维护了一个优先列表,每次根据允许的收集时间,优先选择回收价值最大的 Region(这也就是它的名字 Garbage-First 的由来)。这种使用 Region 划分内存空间以及有优先级的区域回收方式,保证了 G1 收集器在有限时间内可以尽可能高的收集效率(把内存化整为零)。