目录
这里将《Java虚拟机规范中文版》上传了,点击下面链接,即可下载:
前言
从前面的《运行时内存区域》系列文章中了解到,JVM运行时内存区域主要分为:
堆、方法区、Java虚拟机栈、本地方法栈、程序计数器(PC寄存器)
其中Java虚拟机栈、本地方法栈、程序计数器都是随线程而生,随线程而死;
Java虚拟机栈随着方法的调用,有条不紊的执行出栈和入栈,每个栈帧中的内存分配在类结构确定下时就是已知的。
而堆和方法区的内存分配、使用,只有在程序运行时才知道,这部分的内存分配和回收都是动态的。
垃圾收集回收(GC)主要针对堆和方法区。
什么是垃圾收集回收(GC)
垃圾收集回收就是自动释放程序不再引用的对象的过程。
为什么垃圾收集回收(GC)
垃圾收集回收:意味着'程序不在需要的对象'是"垃圾",并且可以被抛弃。
当程序不再引用某个对象时,它所占用的堆空间可以被回收,以便该空间可用于后续的新对象。
垃圾收集回收可以减轻释放已分配的内存负担。
垃圾收集回收(GC)不是Java预研的伴生产物,GC的历史比Java久远。
GC需要完成三件事情:
- 哪些内存需要回收?
- 什么时候回收?
- 如何回收?
问:哪些对象(内存)需要回收?
答:当然是已经死亡的对象(内存)。
堆中存放程序运行时创建的所有实例对象,在对堆进行垃圾回收之前,需要确定一件事情:哪些对象(内存)已经死亡,那些对象(内存)还活着。
有哪些方法可以判定对象(内存)已经死亡呢?
- 引用计数器算法
- 根搜索算法
引用计数器算法
简单直观的办法,效率较高,被称作"引用计数器算法".
不过这个算法有一个致命的缺陷,那就是对于循环引用的对象无法进行回收.
书上的Demo看不出那个输出结果,我们看另外一个栗子,意会一下就好:
/**
* Test_引用计数器算法
*/
public class GC_Object {
Object field = null;
public static void main(String[] args) {
Thread thread = new Thread(new Runnable() {
@Override
public void run() {
GC_Object objectA = new GC_Object();
GC_Object objectB = new GC_Object();//1
objectA.field = objectB;
objectB.field = objectA; //2
//do something...
objectA = null;
objectB = null; //3
}
});
thread.start();
while (true);
}
}
这段代码看起来有点刻意为之,但其实在实际编程过程当中,是经常出现的;
比如两个一对一关系的数据库对象,各自保持着对方的引用。最后一个无限循环只是为了保持JVM不退出,没什么实际意义。
对于我们现在使用的GC来说,当thread线程运行结束之后,会将objectA和objectB全部作为待回收的对象.
而如果我们的GC采用上面所说的引用计数器算法,则这两个对象永远不会被回收,即使我们在使用后显示的将对象归为空值也没用.
代码中标注了1,2,3个标识符;
当1这个语句执行完毕之后,两个对象的引用计数全部为1.
当2这个语句执行完成之后,两个对象的引用计数全部为2.
当3这个语句执行完毕之后,也就是将二者全部归为空值之后,二者的引用计数器任然为1.
根据引用计数器算法的回收规则,引用计数器没有归0,是不会被回收的.
可达性分析算法
可达性分析算法还有一个名字"根搜索算法"
这个根搜索算法,是后面所有垃圾算法的爸爸...╮(╯▽╰)╭
这个算法的基本思想就是:
通过一系列的称为"GCRoots"的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链。
当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。
原书中的示意图:
如上图所示:对象object5、object6、object7虽然互相有关联,但是它们到GC Roots是不可达的,所以它们被判定是可回收对象。
在Java语言中,可作为GC Roots的对象包括以下几种:
- 虚拟机栈中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈JNI(Native方法)引用的对象
第一和第四种都是指 方法的本地变量表.
第三种主要是声明为final的常量值.
再谈引用
无论是通过引用计数器算法判断对象的应用数量,还是通过可达性分析算法"根搜索算法"判断对象的引用链是否可达,判断对象是否存活都与"引用"有关
"引用"这个词的定义在JDK1.2之前和之后,有两套定义,我们这里只看jdk1.2之后定义的。
在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为 强引用、软引用、弱引用、虚引用 四种。
这四种 引用强度依次逐渐减弱。
强引用
类似于"Object obj= new Object()"这类引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。
软引用
软引用是用来描述一些还有用但并非必须的对象。
对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。
弱引用
弱引用也是用来描述非必须对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集之前。
当垃圾收集器开始工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
虚引用
虚引用也被称为:幽灵引用、幻影引用,它是最弱的一种引用关系。
一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。
生存还是死亡
在垃圾搜索算法中,即使是可达性分析算法(根搜索算法)中不可达的对象,也并非是"非死不可"的,这时候他们暂时处于"缓刑"阶段。
要真正宣告一个对象死亡,至少需要经理两次标记过程:
- 对象在进行第一次可达性分析后发现没有与GC Roots相连的引用链,那它将会被第一次标记并且进行一次筛选。
- 筛选的条件是此对象是否有必要执行finalize()方法,当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为"没有必要执行"
接下去,如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做"F-Queue"的队列之中,然后虚拟机会创建线程去执行。
这里的"执行"是指:虚拟机触发finalize()方法。
不过不建议使用finalize()方法,使用try-finally或者其他的方法都可以做的更好。
回收方法区
很多人认为方法区(Hotspot中的永久代)是没有垃圾收集的,的确,《Java虚拟机规范》中确实说过不强制要求虚拟机在方法区实现垃圾收集。
而且在方法区中进行垃圾搜集的"性价比"一般比较低。
方法区(Hptspot"永久代")的垃圾搜集主要回收两个部分内容:废弃常量和无用的类。
回收废弃常量与回收Java堆中的对象非常类似,我们以常量池中的字面量回收举个栗子:
假如一个字符串"abc"已经进入了常量池,但是当前系统中没有任何一个String对象是叫做"abc"的,换句话说,就是没有任何String对象指向常量池中的"abc"常量,也没有任何地方引用了这个字面量;
如果这个时候发生了内存回收,而且必要的话,这个"abc"常量会被系统清理出常量池。
判定一个常量是否是"废弃常量"比较简单,而要判定一个类是否是"无用的类"的条件则相对苛刻很多,需要同时满足以下三个条件:
- 该类所有的实例都已经被垃圾回收,也就是Java堆中不存在该类的任何实例。
- 加载该类的ClassLoader已经被回收。
- 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
虚拟机可以对满足上述三个条件的无用类进行回收,这里说的仅仅是"可以",而并不是像对象一样,不使用了就必然会回收,这个可以通过参数自己控制。