1. 标记-清除算法
最基础的收集算法是“标记-清除”(mark-sweep)算法,如同它的名字一样,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
1) 标记-清除算法的两个阶段
(A)标记
首先标记出所有需要回收的对象。
① 第一次标记
在可达性分析后发现对象到GC Roots没有任何引用链相连时,被第一次标记;并且进行一次筛选:此对象是否必要执行finalize()方法;对有必要执行finalize()方法的对象,被放入F-Queue队列中;
② 第二次标记
GC将对F-Queue队列中的对象进行第二次小规模标记;
在其finalize()方法中重新与引用链上的任何一个对象建立关联,第二次标记时会将其移出“即将回收”的集合;
对第一次被标记,且第二次还被标记(如果需要,但没有移出“即将回收”的集合),就可以认为该对象已死,可以进行回收。
(B)清除
两次标记后,还在“即将回收”集合的对象将会被统一回收;
执行过程如下:
2) 缺点:
它的主要不足有两个:一个是效率问题,标记和清除两个过程的效率都不高;另一个是空间问题,标记清除后产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到最够的连续内存而不得不提前触发另一次垃圾收集动作。
2. 复制算法
为了解决效率问题,一种称为“复制”(Copying)的收集算法出现了,它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复制情况,只要移动堆顶指针,按顺序分配内存即可。
1 ) 算法思路:
(A)把内存划分为大小相等的两块,每次只使用其中一块;
(B)把一块内存用完了,就将还存活的对象复制到另一块上(而后使用这一块);
(C)再把已使用过的那块内存空间一次清理掉,而后重复步骤B。
执行过程如下图:
2 ) 优点:
① 使得每次都是只对整个半区进行内存回收;
② 内存分配时不必考虑内存碎片等问题(只要移动堆顶指针,按顺序分配内存即可);
③ 实现简单,运行高效。
3) 缺点:
① 空间浪费:可用内存缩减为原来的一半,太过浪费(新生代中的对象98%是“朝生夕死”的,所以并不需要按1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间);
② 效率随对象存活率升高而降低:当对象存活率较高时,需要进行较多复制操作,效率将会变低。
4) 应用场景:
现在商业JVM都通过改良缺点1来回收新生代。
如Serial收集器、ParNew收集器、Parallel Scavenge收集器、G1。
5) HotSpot虚拟机的改良算法
① 弱代理论
分代垃圾收集基于弱代理论(weak generational hypothesis),具体描述如下:
a) 大多数分配了内存的对象并不会存活太长时间,在处于年轻代就会死掉;
b) 很少有对象会从老年代变成年轻代;
② HotSpot虚拟机新生代内存布局及算法
a) 将新生代内存分为一块较大的Eden空间和两块较小的Survivor空间;
b) 每次使用Eden和其中一块Survivor;
c) 当回收时,将Eden和使用中的Survivor中还存活的对象一次性复制到另外一块Survivor;
d) 而后清理掉Eden和使用过的Survivor空间;
e) 后面就使用Eden和复制到的那一块Survivor空间,重复步骤3;
默认Eden:Survivor=8:1,即每次可以使用90%的空间,只有一块Survivor的空间被浪费;
③ 分配担保
如果另一块Survivor空间没有足够空间存放上一次新生代收集下来的存活对象时,这些对象将直接通过分配担保机制(Handle Promotion)进入老年代;
3. 标记-整理算法
复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所要对象都100%存活的极端情况,所以在老年代一般不能直接选用这种算法。
1) 算法思路
A) 标记
标记过程与“标记-清除”算法一致;
B)整理
但后续不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动;然后直接清理掉端边界以外的内存;
执行过程如下:
2)优点:
A) 不会像复制算法、效率随对象存活率升高而变低
老年代特点:对象存活率高,没有额外的空间可以分配担保,所有老年代一般不能直接选用复制算法而选用标记-整理算法。
B) 不会像标记-清除算法,产生内存碎片
因为清除前,进行了整理,存活对象都集中到空间一侧。
3) 缺点
主要是效率问题:除像标记-清除算法的标记过程外,还多了需要整理的过程,效率更低。
4)应用
如 serial old收集器
4. 分代收集算法
分代收集(Generational Collection)算法结合不同的收集算法处理不同区域。
1) 算法思路
基于前面说的弱代理论,其实并没有什么新的思想;只是根据对象存活周期的不同将内存划分为几块;这样就可以根据各个年代的特点采用最适当的收集算法;一般把Java堆分为新生代和老年代;
2)新生代
每次垃圾收集都有大批对象死去,只有少量存活,所以可以采用复制算法;
3)老年代
对象存活率高,没有额外的空间可以分配担保,使用“标记-清除”或“标记-整理”算法。
优点:
可以根据各个年代的特点采用最适当的收集算法;
缺点:
仍然不能控制每次垃圾收集的时间;
应用场景:
如HotSpot虚拟机中全部垃圾收集器:Serial、ParNew、Parallel Scavenge、Serial Old、Parallel Old、CMS、G1(也保留);