前言
本文主要介绍一下JVM的垃圾回收机制。
垃圾回收(Garbage Collection,GC):简单说就是释放垃圾占用的空间,防止内存泄露。有效的使用可用的内存,对内存堆中已经死亡的或者长时间没有使用的对象进行清除和回收。
在Java中垃圾回收主要关注JVM堆内存是如何回收的。
我们先简单了解下堆内存
堆内存区域简介
在JVM堆中主要分为年轻代、老年代和元空间(JDK1.8之前是永久代)
-
年轻代:用于存放新产生的对象。
-
老年代:用于存放被长期引用的对象。
-
永久代:用于存放Class,method元信息(1.8之后改为元空间)
-
元空间:JDK1.8之后,取消perm永久代,转而用元空间代替
元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存,并且可以动态扩容。
为什么堆内存需要分代?
因为不同对象的生命周期是不一样的。百分之八九十的对象都是“朝生夕死”,生命周期很短,大部分新对象都在年轻代,可以很高效地进行回收,不用遍历所有对象。而进入老年代中对象生命周期一般很长,每次可能只回收一小部分内存,回收效率很低。
垃圾回收
1. 怎么定义垃圾
既然我们要做垃圾回收,首先我们得搞清楚垃圾的定义是什么?哪些内存是需要回收的?
1.1 引用计数法
简单的说就是给对象中添加一个引用计数器,每当有一个地方引用它,计数器就加1;当引用失效,计数器就减1;任何时候计数器为0 的对象就是不可能再被使用的。
这个方法实现简单,效率高,但是目前主流的虚拟机中并没有选择这个算法来管理内存,其最主要的原因是它很难解决对象之间相互循环引用的问题。 所谓对象之间的相互引用问题,如下面代码所示:
public class ReferenceCountingGc {
Object instance = null;
public static void main(String[] args) {
ReferenceCountingGc objA = new ReferenceCountingGc();
ReferenceCountingGc objB = new ReferenceCountingGc();
objA.instance = objB;
objB.instance = objA;
objA = null;
objB = null;
}
}
上面代码中除了对象objA和objB相互引用着对方之外,这两个对象之间再无任何引用。但是他们因为互相引用对方,导致它们的引用计数器都不为0,这就导致引用计数算法无法通知GC回收器回收他们。
1.2 可达性分析算法
可达性分析算法是将“GC Roots” 对象作为起点,从这些节点开始向下搜索引用的对象,找到的对象都标记为非垃圾对象,其余未标记的对象都是垃圾对象。如下图中的object5,6,7三个因为和gcRoot已经没有任何联系,则判断为可回收的对象。
哪些对象可以作为GC Roots根节点呢?
-
虚拟机栈的局部变量表
如下代码所示,a 是栈帧中的本地变量,当 a = null 时,由于此时 a 充当了 GC Root 的作用,a 与原来指向的实例 new Test() 断开了连接,所以对象会被回收。
public class Test {
public static void main(String[] args) {
Test a = new Test();
a = null;
}
}
-
方法区中类静态属性引用的对象
如下代码所示,当栈帧中的本地变量 a = null 时,由于 a 原来指向的对象与 GC Root (变量 a) 断开了连接,所以 a 原来指向的对象会被回收,而由于我们给 s 赋值了变量的引用,s 在此时是类静态属性引用,充当了 GC Root 的作用,它指向的对象依然存活。
public class Test {
public static Test s;
public static void main(String[] args) {
Test a = new Test();
a.s = new Test();
a = null;
}
}
-
方法区中常量引用的对象
如下代码所示,常量 s 指向的对象并不会因为 a 指向的对象被回收而回收
public class Test {
public static final Test s = new Test();
public static void main(String[] args) {
Test a = new Test();
a = null;
}
}
-
本地方法栈中 JNI(即一般说的 Native 方法)引用的对象
当调用 Java 方法时,虚拟机会创建一个栈桢并压入 Java 栈,而当它调用的是本地方法时,虚拟机会保持 Java 栈不变,不会在 Java 栈祯中压入新的祯,虚拟机只是简单地动态连接并直接调用指定的本地方法。
如下代码所示,当 java 调用以上本地方法时,jc 会被本地方法栈压入栈中, jc 就是我们说的本地方法栈中 JNI 的对象引用,因此只会在此本地方法执行完成后才会被释放。
JNIEXPORT void JNICALL Java_com_pecuyu_jnirefdemo_MainActivity_newStringNative(JNIEnv *env, jobject instance,jstring jmsg) {
...
// 缓存String的class
jclass jc = (*env)->FindClass(env, STRING_PATH);
}
2. 怎么回收垃圾
在确定了哪些垃圾可以被回收后,垃圾收集器要做的事情就是开始进行垃圾回收,但是这里面涉及到一个问题是:如何高效地进行垃圾回收?
由于Java虚拟机规范并没有对如何实现垃圾收集器做出明确的规定,因此各个厂商的虚拟机可以采用不同的方式来实现垃圾收集器,这里我们讨论几种常见的垃圾收集算法的核心思想。
2.1 标记—清除算法
先将内存中判断可回收的对象标记出来,然后再进行清理。
缺点:标记清除后会产生大量不连续的碎片
2.2 标记—清除算法
复制算法是在标记清除算法上演化而来,解决标记清除算法的内存碎片问题。它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用,内存分配时也就不用考虑内存碎片等复杂情况,逻辑清晰,运行高效。
它的缺点也很明显:浪费空间
2.3 标记—整理算法
标记整理算法的标记过程仍然与标记清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,再清理掉端边界以外的内存区域。
标记整理算法一方面在标记-清除算法上做了升级,解决了内存碎片的问题,也规避了复制算法只能利用一半内存区域的弊端。看起来很美好,但从上图可以看到,它对内存变动更频繁,需要整理所有存活对象的引用地址,在效率上比复制算法要差很多。
缺点:效率低
2.4 分代收集算法
严格来说并不是一种思想或理论,而是融合上述3种基础的算法思想。
基于分代收集理论 :根据不同代的特点,选择不同的收集算法