我们之前了解到了Java内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈这3个区域随线程而生,随线程而灭。这几个区域不需要过多考虑垃圾回收问题,因为方法或者线程结束时,内存自热就跟着回收了。而Java堆和方法区则不一样,它们属于内存共享的区域,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间才能知道会创建哪些对象,因此这才是垃圾回收需要重点关注的区域。
在java堆中存活着几乎所有的对象实例,垃圾收集器在回收之前需要判断哪些对象还存活着,哪些对象已经死去。
1.1、引用计数法
引用计算法的算法大致如下:给对象添加一个引用计数器,每当有地方引用它时,计数器就加1;当引用失效时,计数器就减1;当计数器为0时就表示该对象已经死去。
客观的说,引用计数法的实现简单,判定效率也很高,在大多数情况下是一种不错的算法,也有很多经典的应用案例,比如微软公司的COM(Component Object Model)技术、使用ActionScript 3的FlashPlayer、Python语言和在游戏脚本领域广泛应用的Squirrel中都使用了引用计数算法进行了内存管理。但在主流的java虚拟机中没有选用引用计数法来管理内存,主要是因为它很难解决对象之间相互循环引用的问题。
现在我们就通过对象循环引用的例子来测试java虚拟机是否会回收?
/**
* 测试java虚拟机是否是用引用计数法进行垃圾回收
*
* @author sj
*
*/
public class ReferenceCountTest {
public Object instance = null;
private static final int oneMB = 1024 * 1024;
/**
* 该成员属性用来占点内存,方便在GC日志中观察内存回收过程
*/
private byte[] bigSize = new byte[3 * oneMB];
public static void main(String[] args) {
ReferenceCountTest a = new ReferenceCountTest();
ReferenceCountTest b = new ReferenceCountTest();
a.instance = b;
b.instance = a;
a = null;
b = null;
// 当发生GC时,对象a和对象b能否被回收?
System.gc();
}
}
执行后输出结果如下:
[GC[DefNew: 3779K->377K(4928K), 0.0557995 secs] 3779K->3449K(15872K), 0.0707880 secs] [Times: user=0.00 sys=0.05, real=0.07 secs]
[Full GC[Tenured: 3072K->376K(10944K), 0.0649112 secs] 6617K->376K(15872K), [Perm : 183K->183K(12288K)], 0.0650030 secs] [Times: user=0.00 sys=0.00, real=0.07 secs]
Heap
def new generation total 4992K, used 44K [0x24a00000, 0x24f60000, 0x29f50000)
eden space 4480K, 1% used [0x24a00000, 0x24a0b398, 0x24e60000)
from space 512K, 0% used [0x24e60000, 0x24e60000, 0x24ee0000)
to space 512K, 0% used [0x24ee0000, 0x24ee0000, 0x24f60000)
tenured generation total 10944K, used 376K [0x29f50000, 0x2aa00000, 0x34a00000)
the space 10944K, 3% used [0x29f50000, 0x29fae1e8, 0x29fae200, 0x2aa00000)
compacting perm gen total 12288K, used 183K [0x34a00000, 0x35600000, 0x38a00000)
the space 12288K, 1% used [0x34a00000, 0x34a2dcc0, 0x34a2de00, 0x35600000)
ro space 10240K, 44% used [0x38a00000, 0x38e7c1d8, 0x38e7c200, 0x39400000)
rw space 12288K, 52% used [0x39400000, 0x39a440c0, 0x39a44200, 0x3a000000)
我们可以看到GC日志中包含“3779K->377K”,这说明虚拟机并没有因为这两个对象相互引用就没有回收它们,间接说明了java虚拟机用的不是引用计数法来判断对象是否存活。
1.2、可达性分析算法
在主流的商用语言中(例如Java、C#)的主流实现中,都是通过可达性分析(Reachability Analysis)来判定对象是否存活的。这个算法的思路就是:
通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时(也就是从GC Roots到这个对象不可达时 ),则说明此对象是不可用的。如下图所示,虽然Object5、Object6、Object7之间是相互关联的,但它们与GC Roots是断开的,所以它们被判定为可回收的对象。
在java中,可作为GC Roots的对象有以下几种:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象。
- 方法区中类静态属性引用的对象。
- 方法区中常量引用的对象。
- 本地方法栈中JNI(即一般说的Native方法)引用的对象。
1.3、四种引用类型
在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)四种,这四种引用强度依次逐渐减弱。以下是它们的定义:
- 强引用就是指在程序代码中普遍存在的,类型“Object object = new Object()”这类的引用,垃圾回收器永远不会回收这类被引用的对象。
- 软引用用来描述一些还有用但并非必须的对象。对于软引用关联的对象,在系统将要发生内存溢出之前,将会将这些对象列进回收范围进行第二次回收。若这次回收后还没有足够的内存,才会抛出内存溢出异常,在JDK1.2后,提供了SoftReference类来实现软引用。
- 弱引用也用来描述非必须对象,但它的强度比软引用更弱些,被弱引用关联的对象只能生存到下一次垃圾回收之前。无论当前内存是否足够,垃圾回收都会回收掉被弱引用的对象。JDK1.2后,专门用WeakReference类来实现弱引用。
- 虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设立虚引用的目的就是在这个对象被垃圾回收前收到一条系统通知。JDK1.2后,提供了PhantomRerence类来实现虚引用。
1.4、对象生存或死亡
在可达性分析算法中不可达的对象,并非一定会垃圾回收的,这时候它们暂时处于“缓刑“阶段,要真正宣告一个对象的死亡,至少要经历两次标记过程:
- 如果对象在进行可达性分析时发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。
- 如果这个对象被判定为有必要执行finalize()方法,那么这个对象将被放置在一个叫做F-Queue的队列之中,并在稍后由虚拟机自动建立的、低优先级的Finalizer线程去执行它。这里所谓的执行是指虚拟机会触发这个方法,但它不会承诺会等待它运行结束。这样做的原因是,如果对象在finalize()方法中运行缓慢,或者发生了死循环或更糟糕的情况,这将可能导致F-Queue队列中其他对象永久处于等待,甚至整个内存回收系统崩溃。finalize方法是对象逃脱被回收的最后一次机会,稍后GC将对F-Queue队列中的对象进行第二次小规模的标记,如果对象要在finalize中成功拯救自己——只要重新与GC Roots重新建立关联即可,这样在第二次标记时它将被移出“即将回收”集合,否则将会被回收。
1.5、回收方法区
在堆中,尤其在新生代中,常规进行一次垃圾回收一般可以回收70%~95%的空间,而方法区(或者HotSpot虚拟机中的永久代)的垃圾回收效率远低于此。
方法区的垃圾回收主要回收两部分内容:废弃常量和无用的类。
判断一个常量是否为废弃常量的条件比较简单,以常量池中字面量的回收为例,假如一个字符串“a”已经进入了常量池中,但当前系统没有任何一个String对象是叫做“a”的,也就是说没有任何String对象引用长常量池中的“a”变量,也没有其他地方引用了这个字面量,那么垃圾回收时,这个“a”常量就会被系统清理出常量池。常量池中的其他类(接口)、方法、字段的符号引用也与此类似。
判断一个类是否是无用的类条件就苛刻些,需要满足以下三个条件才可以被回收,而不是像对象一样不使用了,必然被回收,是否被类进行回收,Hotspot虚拟机提供了相关参数进行控制:
- 该类的所有实例都已经被回收。
- 加载该类的ClassLoader已经被回收。
- 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
在大量使用反射、动态代理、CGLib等ByteCode框架、动态生成JSP以及OSGI这类频繁自定义ClassLoader的场景都需要虚拟机具备类卸载的功能,以保证方法区(永久代)不溢出。
参考:
深入理解Java虚拟机第3章-周志明