一.在介绍JVM中的垃圾回收算法之前,先了解一下垃圾回收器如何判断对象是“存活”还是“死去”(即不可能再被任何途径使用的对象)。
1.引用计数算法
这个算法的思想是:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器值为0的对象是不可能再被使用的。
这个算法的实现简单,判定效率也高,但是,主流的Java虚拟机里面没有选用计数算法来管理内存,因为计数算法很难解决对象之间相互循环引用的问题。
public class ReferenceCountingGC {
public Object instance=null;
private static final int _1MB=1024*1024;
private byte[] bigSize=new byte[2*_1MB];
public static void testGC(){
ReferenceCountingGC objA=new ReferenceCountingGC();
ReferenceCountingGC objB=new ReferenceCountingGC();
objA.instance=objB;
objB.instance=objA;
objA=null;
objB=null;
//假设在这里发生GC,objA和objB是否能被回收?
System.gc();
}
}
举个例子,上述代码中的testGC()方法:对象objA和objB都有字段instance,赋值令objA.instance=objB及objB.instance=objA,除此之外,这两个对象再无任何引用,实际上这两个对象已经不可能再被访问,但是它们因为互相引用着对方,导致它们的引用计数都不为0,所以引用计数算法无法通知GC收集器回收它们。
2.可达性分析算法
这个算法的基本思路就是通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。如下图所示,对象object 5、object 6、object 7虽然互相有关联,但是它们到GC Roots是不可达的,所以它们将会被判定是可回收的对象。
在Java语言中,可作为GC Roots的对象有:
(1)虚拟机栈(栈帧中的本地变量表)中引用的对象
(2)方法区中类静态属性引用的对象
(3)方法区中常量引用的对象
(4)本地方法栈中JNI(即一般说的Native方法)引用的对象
二.垃圾回收算法
1.标记-清除算法
算法思想:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
这个算法有两个缺点:一是效率问题,标记和清除两个过程的效率都不高;另外是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后再程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
2.复制算法
算法思想:将可用内存空间划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完时,就将还存活的对象复制到另外一块上,然后再把已使用过的内存空间一次清理掉。
这个算法的好处是使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。不过这种算法的代价是将内存缩小为原来的一半。
3.标记整理算法
算法思想:首先标记出所有需要回收的对象,然后让所有存活的对象向一端移动,然后直接清理掉端边界以外的内存。
这种算法的缺点是算法复杂度大,执行步骤较多。
4.分代收集算法
算法思想:首先根据对象存货周期的不同将内存划分为几块,一半是把Java堆分为新生代和老年代,然后根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都有大批对象死亡,只有少量存活,所以采用复制算法;而老年代中因为对象存活率高,所以采用标记-清除算法或者标记-整理算法。
以上便是这次的内容。
注:参考文献:《深入理解Java虚拟机:JVM高级特性与最佳实践》——周志明 著