对象死亡判断和垃圾收集算法
仅作为笔记
文章目录
前言
随着线程消失而消失的有:程序计数器、虚拟机栈、本地方法栈,这三个地区不需要考虑内存回收的问题,而java堆和方法区不一样,多个实现类需要的内存不一样,方法的多个分支需要的内存也不一样,这些都只能在程序处于运行期间才能确定,意味着这些内存都是动态分配的,所以垃圾收集器关注的只是这部分。
仅作为笔记
一、对象已死吗?
既然叫做垃圾回收,那么肯定是没用了才会收,所以得先判定这个对象死没死。
1.1、引用计数算法
- 算法:核心思想是给对象添加一个引用计数器,每当有一个地方引用他,就给他加1,反之,如果取消了引用那么久减1,但是这没有被主流的java虚拟机用来管理内存,因为这会出现很明显的对象相互引用问题。比如,对象A和B都有instance元素,如果他们A.instance = B.instance,B.instance = A.instance,那么他们构成了相互引用,意味着他们的引用计数器永远不会为0,这样就不能回收他们。
1.2、可达性分析算法
- 这是主流的方法!通过称为GC Roots的对象作为起点,从这些节点向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,这个对象就是可以被回收的。如下所示:
关于引用链,和ThreadLocal的ThreadLocalMap为什么要使用弱引用有关联,可以理解为采用弱引用可以更好地破坏这条引用链,而强引用必须手动来破坏。可以点击这里回顾一下。 - 在Java语言里,作为GC Roots的对象有以下几种:
1).虚拟机栈(栈中的本地变量表)中引用的对象。
2)方法区中类静态属性引用的对象。
3)方法区中常量引用的对象。
4)本地方法栈中JNI(也就是Native方法,全称:Java Native Interface,Java本地接口,是Java语言的本地编程接口)引用的对象。
1.3、再谈引用
- java对引用的传统说法是:如果reference类型的数据中存储的数值代表的是另一块内存的起始地址,这块内存就代表一个引用。
- java传统定义过于狭隘,实际上还有强、软、弱、虚四种引用。详细看我的另一篇博文,点击这里
1.4、生存还是死亡
先知道一个方法:finalize()方法,这是属于Object的protected方法,子类可以覆盖该方法以实现资源清理工作,在GC回收对象前调用该方法。该方法每个对象只能执行一次。这是一个java诞生之初向c/c++程序员做出妥协的方法,并不推荐使用!finalize()能做的工作,使用try-finally或者其他方式都能做到更好,更及时。这个对象的本质作用只是在对象死刑前最后一次争取活下去的机会,看能否与GC Roots产生引用链的机会。
- 引用链的断裂并不会直接判定对象死刑,而是做一次标记,如果二次被发现还是没有引用链才会被判处死刑。
- 这个第二次判定就是当对象第一次被标记引用链断裂后,会将这个对象放在一个叫做F-Queue的队列之中,稍后由虚拟机自动建立的叫做Finalizer线程去执行他,也就是调用他的finalize()方法,看这个对象能否再产生引用链(比如给某个类表里赋值等)。如果能,那么这个对象就不用被回收了,如果还是没有。那么就要回收。
- 上面提到的二次标记,但是如果对象没有覆盖finalize()方法,或者finalize()方法已经被调用过一次了,那么这个对象就没机会再执行finalize()方法了(一个对象只有一次机会)。
1.5、回收方法区
注意:JDK1.8取消了方法区,用元空间将其替代了,元空间没有使用堆内存,而是本地内存区域,不会出现永久代存在的内存溢出问题。但是这里还是讨论下JDK1.8之前的方法区。
- 方法区分为两个大部分:1)已加载的类信息。2)运行时常量池。
- 垃圾收集主要回收两部分内容:1)废弃常量。2)无用的类。
- 废弃常量:以字符串为例,当常量池中的字符串没有被任何的String类型所引用时就会判断这个字面量可以被回收,并且必要的话还可以清出常量池。
- 无用的类:1)该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例。2)加载该类的ClassLoader已经被回收。3)该类对应的java.lang.Class对象(在类加载机制中的加载阶段生成的)没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。以上几点仅仅是说“可以”回收,实际上是否回收还得通过参数控制。
二、垃圾收集算法
2.1、标记-清除算法
即把死亡对象所占据的内存标记为空闲内存,并记录在一个空闲列表(free list)之中。当需要新建对象时,内存管理模块便会从该空闲列表中寻找空闲内存,并划分给新建的对象。
-
这算是垃圾收集算法的基础,算法分为两个阶段:
1)标记出所有需要回收的对象,标记过程看前一节。
2)在标记完成后统一回收所有被标记的对象。
如下图:
-
不足:
1)标记和清除两个过程的效率都不高,对于空闲列表,Java 虚拟机则需要逐个访问列表中的项,来查找能够放入新建对象的空闲内存。
2)标记清除之后会产生大量不连续的内存碎片,大内存的对象没办法使用碎片内存造成内存浪费。
2.2、标记-复制算法
-
算法步骤:
1)将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。
2)当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。如下图:
-
优点:1)不存在碎片问题。2)实现简单,运行高校。
-
缺点:1)碎片已经够浪费空间了,这个直接浪费一半。随意需要进行优化。
-
实际上复制算法的改良版是现在商业虚拟机都在用的。由于新生代中的对象百分之98都是朝生夕死的,所以将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。
-
Hot Spot虚拟机默认Eden和Survivor为8:1,也就是整个新生代中可以使用的内存是百分之90(80%+10%),只有10%浪费了。但是!有时候可能活下来的对象过多,另一块Survivor存不下了,这时候就需要依赖老年代。老年代相当于是为新生代做的分配担保,通过分配担保机制存入老年代。
2.3、标记-整理算法(也叫压缩算法)
- 针对老年代提出来的算法,老年代没有担保,所以只能靠自己,在内部进行整理去碎片。
- 标记过程与标记清理一样,只是不会直接回收,而是进行整理了再回收。让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
2.4、分代收集算法
根据对象存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记—清理”或者“标记—整理”算法来进行回收。