第02讲:GC 回收机制与分代回收策略

垃圾回收(Garbage Collection,简写为 GC)可能是虚拟机众多知识点中最为大众所熟知的一个了,也是Java开发者最关注的一块知识点。Java 语言开发者比 C 语言开发者幸福的地方就在于,我们不需要手动释放对象的内存,JVM 中的垃圾回收器(Garbage Collector)会为我们自动回收。但是这种幸福是有代价的:一旦这种自动化机制出错,我们又不得不去深入理解 GC 回收机制,甚至需要对这些“自动化”的技术实施必要的监控和调节。

上一节课我介绍了 Java 内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈 3 个区域随线程而生,随线程而灭;栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈操作,这几个区域内不需要过多考虑回收的问题。

而堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间时才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的就是这部分内存。

什么是垃圾

所谓垃圾就是内存中已经没有用的对象。 既然是”垃圾回收",那就必须知道哪些对象是垃圾。Java 虚拟机中使用一种叫作可达性分析的算法来决定对象是否可以被回收。

可达性分析

可达性分析算法是从离散数学中的图论引入的,JVM 把内存中所有的对象之间的引用关系看作一张图,通过一组名为”GC Root"的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,最后通过判断对象的引用链是否可达来决定对象是否可以被回收。如下图所示:
在这里插入图片描述
比如上图中,对象A/B/C/D/E 与 GC Root 之间都存在一条直接或者间接的引用链,这也代表它们与 GC Root 之间是可达的,因此它们是不能被 GC 回收掉的。而对象M和K虽然被对J 引用到,但是并不存在一条引用链连接它们与 GC Root,所以当 GC 进行垃圾回收时,只要遍历到 J/K/M 这 3 个对象,就会将它们回收。

注意:上图中圆形图标虽然标记的是对象,但实际上代表的是此对象在内存中的引用。包括 GC Root 也是一组引用而并非对象。

GC Root 对象

在 Java 中,有以下几种对象可以作为 GC Root:

  1. Java 虚拟机栈(局部变量表)中的引用的对象。
  2. 方法区中静态引用指向的对象。
  3. 仍处于存活状态中的线程对象。
  4. Native 方法中 JNI 引用的对象。

什么时候回收

不同的虚拟机实现有着不同的 GC 实现机制,但是一般情况下每一种 GC 实现都会在以下两种情况下触发垃圾回收。

  1. Allocation Failure:在堆内存中分配时,如果因为可用剩余空间不足导致对象内存分配失败,这时系统会触发一次 GC。
  2. System.gc():在应用层,Java 开发工程师可以主动调用此 API 来请求一次 GC。

代码验证 GC Root 的几种情况

现在我们了解了 Java 中的 GC Root,以及何时触发 GC,接下来就通过几个案例来验证 GC Root 的情况。在看具体代码之前,我们先了解一个执行 Java 命令时的参数。

-Xms 初始分配 JVM 运行时的内存大小,如果不指定默认为物理内存的 1/64。

比如我们运行如下命令执行 HelloWorld 程序,从物理内存中分配出 200M 空间分配给 JVM 内存。

java -Xms200m HelloWorld

验证虚拟机栈(栈帧中的局部变量)中引用的对象作为 GC Root

运行如下代码:

//vm 参数:-Xms200m
public class GCRootLocalVariable {
    private int _10MB = 10 * 1024 * 1024;
    private byte[] memory = new byte[8 * _10MB];

    public static void main(String[] args){
        System.out.println("开始时:");
        printMemory();
        method();
        System.gc();
        System.out.println("第二次GC完成");
        printMemory();
    }

    public static void method() {
        GCRootLocalVariable g = new GCRootLocalVariable();
        System.gc();
        System.out.println("第一次GC完成");
        printMemory();
    }

    /**
     * 打印出当前JVM剩余空间和总的空间大小
     */
    public static void printMemory() {
        System.out.print("free is " + Runtime.getRuntime().freeMemory()/1024/1024 + " M, ");
        System.out.println("total is " + Runtime.getRuntime().totalMemory()/1024/1024 + " M, ");
    }
}

打印日志:

程序开始:
free is 197 M, total is 200 M, 
第一次GC完成
free is 116 M, total is 200 M, 
第二次GC完成
free is 198 M, total is 200 M, 

可以看出:

  • 当第一次 GC 时,g 作为局部变量,引用了 new 出的对象(80M),并且它作为 GC Roots,在 GC 后并不会被 GC 回收。
  • 当第二次 GC:method() 方法执行完后,局部变量 g 跟随方法消失,不再有引用类型指向该 80M 对象,所以第二次 GC 后此 80M 也会被回收。

注意:上面日志包括后面的实例中,因为有中间变量,所以会有 1M 左右的误差,但不影响我们分析 GC 过程。

验证方法区中的静态变量引用的对象作为 GC Root

运行如下代码:

// vm 参数:-Xms260m
public class GCRootStaticVariable{

    private static int _10MB = 10 * 1024 * 1024;

    private byte[] memory;

    private static GCRootStaticVariable staticVariable;



    public GCRootStaticVariable(int size) {

        memory = new byte[size];

    }



    public static void main(String[] args){

        System.out.println("程序开始:");

        printMemory();

        GCRootStaticVariable g = new GCRootStaticVariable(4 * _10MB);

        g.staticVariable = new GCRootStaticVariable(8 * _10MB);

        // 将g置为null, 调用GC时可以回收此对象内存

        g = null;

        System.gc();

        System.out.println("GC完成");

        printMemory();

    }



    /**

     * 打印出当前JVM剩余空间和总的空间大小

     */

    public static void printMemory() {

        System.out.print("free is " + Runtime.getRuntime().freeMemory()/1024/1024 + " M, ");

        System.out.println("total is " + Runtime.getRuntime().totalMemory()/1024/1024 + " M, ");

    }

}

打印日志:

 程序开始:
 free is 256 M, total is 260 M, 
 GC完成
 free is 176 M, total is 260 M, 

可以看出:

程序刚开始运行时内存为 260M,并分别创建了 g 对象(40M),同时也初始化 g 对象内部的静态变量 staticVariable 对象(80M)。当调用 GC 时,只有 g 对象的 40M 被 GC 回收掉,而静态变量 staticVariable 作为 GC Root,它引用的 80M 并不会被回收。

验证活跃线程作为 GC Root

运行如下代码:

public class GCRootThread{



    private int _10MB = 10 * 1024 * 1024;

    private byte[] memory = new byte[8 * _10MB];



    public static void main(String[] args) throws Exception {

        System.out.println("开始前内存情况:");

        printMemory();

        AsyncTask at = new AsyncTask(new GCRootThread());

        Thread thread = new Thread(at);

        thread.start();

        System.gc();

        System.out.println("main方法执行完毕,完成GC");

        printMemory();



        thread.join();

        at = null;

        System.gc();

        System.out.println("线程代码执行完毕,完成GC");

        printMemory();

    }



    /**

     * 打印出当前JVM剩余空间和总的空间大小

     */

    public static void printMemory() {

        System.out.print("free is " + Runtime.getRuntime().freeMemory()/1024/1024 + " M, ");

        System.out.println("total is " + Runtime.getRuntime().totalMemory()/1024/1024 + " M, ");

    }



    private static class AsyncTask implements Runnable {

        private GCRootThread gcRootThread;



        public AsyncTask(GCRootThread gcRootThread){

            this.gcRootThread = gcRootThread;

        }



        @Override

        public void run() {

            try{

                Thread.sleep(500);

            } catch(Exception e){}

        }

    }

}

打印日志:

 开始前内存情况:
            free is 197 M, total is 200 M,
            main方法执行完毕,完成GC
            free is 116 M, total is 200 M,
            线程代码执行完毕,完成GC
            free is 198 M, total is 200 M,

可以看出:

程序刚开始时是 197M 内存,当调用第一次 GC 时线程并没有执行结束,并且它作为 GC Root,所以它所引用的 80M 内存并不会被 GC 回收掉。 thread.join() 保证线程结束再调用后续代码,所以当调用第二次 GC 时,线程已经执行完毕并被置为 null,这时线程已经被销毁,所以之前它所引用的 80M 此时会被 GC 回收掉。

测试成员变量是否可作为 GC Root

运行如下代码:

public class GCRootClassVariable {
    private GCRootClassVariable classVariable;
    public GCRootClassVariable(int size){
        byte[] memory = new byte[size];
    }

    public static void main(String[] args){
        System.out.println("程序开始:");
        printMemory();
        int _10MB = 10 * 1024 * 1024;
        GCRootClassVariable g = new GCRootClassVariable(4 * _10MB);
        g.classVariable = new GCRootClassVariable(8 * _10MB);
        g = null;
        System.gc();
        System.out.println("GC完成");
        printMemory();
    }
    /**
     * 打印出当前JVM剩余空间和总的空间大小
     */
    public static void printMemory() {
        System.out.print("free is " + Runtime.getRuntime().freeMemory()/1024/1024 + " M, ");
        System.out.println("total is " + Runtime.getRuntime().totalMemory()/1024/1024 + " M, ");
    }
}

打印日志:

程序开始:
free is 196 M, total is 200 M,
GC完成
 free is 198 M, total is 200 M,

从上面日志中可以看出当调用 GC 时,因为 g 已经置为 null,因此 g 中的全局变量 classVariable 此时也不再被 GC Root 所引用。所以最后 g(40M) 和 classVariable(80M) 都会被回收掉。这也表明全局变量同静态变量不同,它不会被当作 GC Root。

上面演示的这几种情况往往也是内存泄漏发生的场景,设想一下我们将各个 Test 类换成 Android 中的 Activity 的话将导致 Activity 无法被系统回收,而一个 Activity 中的数据往往是较大的,因此内存泄漏导致 Activity 无法回收还是比较致命的。

如何回收垃圾

由于垃圾收集算法的实现涉及大量的程序细节,各家虚拟机厂商对其实现细节各不相同,因此本课时并不会过多的讨论算法的实现,只是介绍几种算法的思想以及优缺点。

标记清除算法(Mark and Sweep GC)

从”GC Roots”集合开始,将内存整个遍历一次,保留所有可以被 GC Roots 直接或间接引用到的对象,而剩下的对象都当作垃圾对待并回收,过程分两步。

  1. Mark 标记阶段:找到内存中的所有 GC Root 对象,只要是和 GC Root 对象直接或者间接相连则标记为灰色(也就是存活对象),否则标记为黑色(也就是垃圾对象)。
  2. Sweep 清除阶段:当遍历完所有的 GC Root 之后,则将标记为垃圾的对象直接清除。
    如下图所示:
    在这里插入图片描述
  • 优点:实现简单,不需要将对象进行移动。
  • 缺点:这个算法需要中断进程内其他组件的执行(stop the world),并且可能产生内存碎片,提高了垃圾回收的频率。

复制算法(Copying)

将现有的内存空间分为两快,每次只使用其中一块,在垃圾回收时将正在使用的内存中的存活对象复制到未被使用的内存块中。之后,清除正在使用的内存块中的所有对象,交换两个内存的角色,完成垃圾回收。

  1. 复制算法之前,内存分为 A/B 两块,并且当前只使用内存 A,内存的状况如下图所示:
    在这里插入图片描述
  2. 标记完之后,所有可达对象都被按次序复制到内存 B 中,并设置 B 为当前使用中的内存。内存状况如下图所示:
  • 优点:按顺序分配内存即可,实现简单、运行高效,不用考虑内存碎片。
  • 缺点:可用的内存大小缩小为原来的一半,对象存活率高时会频繁进行复制。

标记-压缩算法 (Mark-Compact)

需要先从根节点开始对所有可达对象做一次标记,之后,它并不简单地清理未标记的对象,而是将所有的存活对象压缩到内存的一端。最后,清理边界外所有的空间。因此标记压缩也分两步完成:

  1. Mark 标记阶段:找到内存中的所有 GC Root 对象,只要是和 GC Root 对象直接或者间接相连则标记为灰色(也就是存活对象),否则标记为黑色(也就是垃圾对象)。
  2. Compact 压缩阶段:将剩余存活对象按顺序压缩到内存的某一端。
    在这里插入图片描述
  • 优点:这种方法既避免了碎片的产生,又不需要两块相同的内存空间,因此,其性价比比较高。
  • 缺点:所谓压缩操作,仍需要进行局部对象移动,所以一定程度上还是降低了效率。

JVM分代回收策略

Java 虚拟机根据对象存活的周期不同,把堆内存划分为几块,一般分为新生代、老年代,这就是 JVM 的内存分代策略。注意: 在 HotSpot 中除了新生代和老年代,还有永久代

分代回收的中心思想就是:对于新创建的对象会在新生代中分配内存,此区域的对象生命周期一般较短。如果经过多次回收仍然存活下来,则将它们转移到老年代中。

年轻代(Young Generation)

新生成的对象优先存放在新生代中,新生代对象朝生夕死,存活率很低,在新生代中,常规应用进行一次垃圾收集一般可以回收 70%~95% 的空间,回收效率很高。新生代中因为要进行一些复制操作,所以一般采用的 GC 回收算法是复制算法。

新生代又可以继续细分为 3 部分:Eden、Survivor0(简称 S0)、Survivor1(简称S1)。这 3 部分按照 8:1:1 的比例来划分新生代。这 3 块区域的内存分配过程如下:

绝大多数刚刚被创建的对象会存放在 Eden 区。如图所示:

在这里插入图片描述
Eden 区第一次满的时候,会进行垃圾回收。首先将 Eden区的垃圾对象回收清除,并将存活的对象复制到 S0,此时 S1是空的。如图所示:
在这里插入图片描述
如此反复在 S0 和 S1之间切换几次(默认 15 次)之后,如果还有存活对象。说明这些对象的生命周期较长,则将它们转移到老年代中。如图所示:
在这里插入图片描述
年老代(Old Generation)
一个对象如果在新生代存活了足够长的时间而没有被清理掉,则会被复制到老年代。老年代的内存大小一般比新生代大,能存放更多的对象。如果对象比较大(比如长字符串或者大数组),并且新生代的剩余空间不足,则这个大对象会直接被分配到老年代上。

我们可以使用 -XX:PretenureSizeThreshold 来控制直接升入老年代的对象大小,大于这个值的对象会直接分配在老年代上。老年代因为对象的生命周期较长,不需要过多的复制操作,所以一般采用标记压缩的回收算法。

注意:对于老年代可能存在这么一种情况,老年代中的对象有时候会引用到新生代对象。这时如果要执行新生代 GC,则可能需要查询整个老年代上可能存在引用新生代的情况,这显然是低效的。所以,老年代中维护了一个 512 byte 的 card table,所有老年代对象引用新生代对象的信息都记录在这里。每当新生代发生 GC 时,只需要检查这个 card table 即可,大大提高了性能。

GC Log 分析

为了让上层应用开发人员更加方便的调试 Java 程序,JVM 提供了相应的 GC 日志。在 GC 执行垃圾回收事件的过程中,会有各种相应的 log 被打印出来。其中新生代和老年代所打印的日志是有区别的。

  • 新生代 GC:这一区域的 GC 叫作 Minor GC。因为 Java 对象大多都具备朝生夕灭的特性,所以 Minor GC 非常频繁,一般回收速度也比较快。
  • 老年代 GC:发生在这一区域的 GC 也叫作 Major GC 或者 Full GC。当出现了 Major GC,经常会伴随至少一次的 Minor GC。

注意:在有些虚拟机实现中,Major GC 和 Full GC 还是有一些区别的。Major GC 只是代表回收老年代的内存,而 Full GC 则代表回收整个堆中的内存,也就是新生代 + 老年代。

接下来就通过几个案例来分析如何查看 GC Log,分析这些 GC Log 的过程中也能再加深对 JVM 分代策略的理解。

首先我们需要理解几个 Java 命令的参数:
在这里插入图片描述
使用如下代码,在内存中创建 4 个 byte 类型数组来演示内存分配与 GC 的详细过程。代码如下:

/**

* VM agrs: -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails

* -XX:SurvivorRatio=8

*/

public class MinorGCTest {

    private static final int _1MB = 1024 * 1024;



    public static void testAllocation() {

        byte[] a1, a2, a3, z4;

        a1 = new byte[2 * _1MB];

        a2 = new byte[2 * _1MB];

        a3 = new byte[2 * _1MB];

        a4 = new byte[1 * _1MB];

    }



    public static void main(String[] agrs) {

        testAllocation();

    }

}

通过上面的参数,可以看出堆内存总大小为 20M,其中新生代占 10M,剩下的 10M 会自动分配给老年代。执行上述代码打印日志如下:

[0.003s][warning][gc] -XX:+PrintGCDetails is deprecated. Will use -Xlog:gc* instead.
[0.015s][info   ][gc] Using G1
[0.016s][info   ][gc,init] Version: 15.0.2+7-27 (release)
[0.016s][info   ][gc,init] CPUs: 16 total, 16 available
[0.016s][info   ][gc,init] Memory: 16113M
[0.016s][info   ][gc,init] Large Page Support: Disabled
[0.016s][info   ][gc,init] NUMA Support: Disabled
[0.016s][info   ][gc,init] Compressed Oops: Enabled (32-bit)
[0.016s][info   ][gc,init] Heap Region Size: 1M
[0.016s][info   ][gc,init] Heap Min Capacity: 20M
[0.016s][info   ][gc,init] Heap Initial Capacity: 20M
[0.016s][info   ][gc,init] Heap Max Capacity: 20M
[0.016s][info   ][gc,init] Pre-touch: Disabled
[0.016s][info   ][gc,init] Parallel Workers: 13
[0.016s][info   ][gc,init] Concurrent Workers: 3
[0.016s][info   ][gc,init] Concurrent Refinement Workers: 13
[0.016s][info   ][gc,init] Periodic GC: Disabled
[0.017s][info   ][gc,metaspace] CDS archive(s) mapped at: [0x0000000800000000-0x0000000800b50000-0x0000000800b50000), size 11862016, SharedBaseAddress: 0x0000000800000000, ArchiveRelocationMode: 0.
[0.017s][info   ][gc,metaspace] Compressed class space mapped at: 0x0000000800b50000-0x0000000840b50000, size: 1073741824
[0.017s][info   ][gc,metaspace] Narrow klass base: 0x0000000800000000, Narrow klass shift: 3, Narrow klass range: 0x100000000
[0.116s][info   ][gc,start    ] GC(0) Pause Young (Concurrent Start) (G1 Humongous Allocation)
[0.116s][info   ][gc,task     ] GC(0) Using 2 workers of 13 for evacuation
[0.117s][info   ][gc,phases   ] GC(0)   Pre Evacuate Collection Set: 0.0ms
[0.117s][info   ][gc,phases   ] GC(0)   Merge Heap Roots: 0.0ms
[0.117s][info   ][gc,phases   ] GC(0)   Evacuate Collection Set: 1.0ms
[0.117s][info   ][gc,phases   ] GC(0)   Post Evacuate Collection Set: 0.1ms
[0.117s][info   ][gc,phases   ] GC(0)   Other: 0.2ms
[0.117s][info   ][gc,heap     ] GC(0) Eden regions: 3->0(9)
[0.117s][info   ][gc,heap     ] GC(0) Survivor regions: 0->1(2)
[0.117s][info   ][gc,heap     ] GC(0) Old regions: 0->0
[0.117s][info   ][gc,heap     ] GC(0) Archive regions: 0->0
[0.117s][info   ][gc,heap     ] GC(0) Humongous regions: 9->9
[0.117s][info   ][gc,metaspace] GC(0) Metaspace: 599K(4864K)->599K(4864K) NonClass: 548K(4352K)->548K(4352K) Class: 51K(512K)->51K(512K)
[0.117s][info   ][gc          ] GC(0) Pause Young (Concurrent Start) (G1 Humongous Allocation) 11M->9M(20M) 1.304ms
[0.117s][info   ][gc,cpu      ] GC(0) User=0.00s Sys=0.00s Real=0.00s
[0.117s][info   ][gc          ] GC(1) Concurrent Cycle
[0.117s][info   ][gc,marking  ] GC(1) Concurrent Clear Claimed Marks
[0.117s][info   ][gc,marking  ] GC(1) Concurrent Clear Claimed Marks 0.005ms
[0.117s][info   ][gc,marking  ] GC(1) Concurrent Scan Root Regions
[0.118s][info   ][gc,marking  ] GC(1) Concurrent Scan Root Regions 0.640ms
[0.118s][info   ][gc,marking  ] GC(1) Concurrent Mark (0.118s)
[0.118s][info   ][gc,marking  ] GC(1) Concurrent Mark From Roots
[0.118s][info   ][gc,task     ] GC(1) Using 3 workers of 3 for marking
[0.118s][info   ][gc,marking  ] GC(1) Concurrent Mark From Roots 0.345ms
[0.118s][info   ][gc,marking  ] GC(1) Concurrent Preclean
[0.119s][info   ][gc,marking  ] GC(1) Concurrent Preclean 0.168ms
[0.119s][info   ][gc,marking  ] GC(1) Concurrent Mark (0.118s, 0.119s) 0.530ms
[0.119s][info   ][gc,start    ] GC(1) Pause Remark
[0.119s][info   ][gc          ] GC(1) Pause Remark 13M->13M(20M) 0.245ms
[0.119s][info   ][gc,cpu      ] GC(1) User=0.00s Sys=0.00s Real=0.00s
[0.119s][info   ][gc,marking  ] GC(1) Concurrent Rebuild Remembered Sets
[0.119s][info   ][gc,marking  ] GC(1) Concurrent Rebuild Remembered Sets 0.123ms
[0.119s][info   ][gc,start    ] GC(1) Pause Cleanup
[0.119s][info   ][gc          ] GC(1) Pause Cleanup 13M->13M(20M) 0.023ms
[0.119s][info   ][gc,cpu      ] GC(1) User=0.00s Sys=0.00s Real=0.00s
[0.119s][info   ][gc,marking  ] GC(1) Concurrent Cleanup for Next Mark
[0.119s][info   ][gc,marking  ] GC(1) Concurrent Cleanup for Next Mark 0.229ms
[0.119s][info   ][gc          ] GC(1) Concurrent Cycle 2.161ms
[0.120s][info   ][gc,heap,exit] Heap
[0.120s][info   ][gc,heap,exit]  garbage-first heap   total 20480K, used 13260K [0x00000000fec00000, 0x0000000100000000)
[0.120s][info   ][gc,heap,exit]   region size 1024K, 2 young (2048K), 1 survivors (1024K)
[0.120s][info   ][gc,heap,exit]  Metaspace       used 621K, capacity 4505K, committed 4864K, reserved 1056768K
[0.120s][info   ][gc,heap,exit]   class space    used 53K, capacity 391K, committed 512K, reserved 1048576K

这是因为在给 a4 分配内存之前,Eden 区已经被占用 6M。已经无法再分配出 2M 来存储 a4 对象。因此会执行一次 Minor GC。并尝试将存活的 a1、a2、a3 复制到 S1 区。但是 S1 区只有 1M 空间,所以没有办法存储 a1、a2、a3 任意一个对象。在这种情况下 a1、a2、a3 将被转移到老年代,最后将 a4 保存在 Eden 区。所以最终结果就是:Eden 区占用 2M(a4),老年代占用 6M(a1、a2、a3)。

通过这个测试案例,我们也间接验证了 JVM 的内存分配和分代回收策略。如果你感兴趣可以在课下尝试使用各种命令参数,给堆的新生代和老年代设置不同的大小来验证不同的结果。

再谈引用

上文中已经介绍过,判断对象是否存活我们是通过GC Roots的引用可达性来判断的。但是JVM中的引用关系并不止一种,而是有四种,根据引用强度的由强到弱,他们分别是:强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)。

任何一本Java面试书籍都会对这四种引用做简单对比,我用一张表格来表示如下:

在这里插入图片描述

平时项目中,尤其是Android项目,因为有大量的图像(Bitmap)对象,使用软引用的场景较多。所以重点看下软引用SoftReference的使用,不当的使用软引用有时也会导致系统异常。

软引用常规使用

常规使用代码如下:

public class SoftReferenceNormal {
    static class SoftObject {
        byte[] data = new byte[120 * 1024 * 1024];// 120M
    }

    public static void main(String[] args) throws InterruptedException{
        //将缓存数据用软引用持有
        SoftReference<SoftObject> cacheRef = new SoftReference<>(new SoftObject());
        PrintlnUtils.println("第一次GC前 软引用:"+cacheRef.get());
        System.gc();

        //进行一次GC后查看对象回收情况
        PrintlnUtils.println("第一次GC后 软引用:"+cacheRef.get());

        //再分配一个120M的对象,看看缓存对象回收情况
        SoftObject softObject = new SoftObject();
        PrintlnUtils.println("再次配一个120M的强引用对象后 软引用:"+cacheRef.get());

    }
}

执行上述代码,打印日志如下:

[0.003s][warning][gc] -XX:+PrintGC is deprecated. Will use -Xlog:gc instead.
[0.008s][info   ][gc] Using G1
[0.072s][info   ][gc] GC(0) Pause Young (Concurrent Start) (G1 Humongous Allocation) 2M->0M(200M) 1.440ms
[0.072s][info   ][gc] GC(1) Concurrent Cycle
[0.125s][info   ][gc] GC(1) Pause Remark 122M->122M(200M) 0.925ms
[0.125s][info   ][gc] GC(1) Pause Cleanup 122M->122M(200M) 0.166ms
[0.127s][info   ][gc] GC(1) Concurrent Cycle 55.406ms
    第一次GC前 软引用:deep2jvmdvm.SoftReferenceNormal$SoftObject@7b23ec81

[0.141s][info   ][gc] GC(2) Pause Full (System.gc()) 122M->121M(200M) 2.193ms
    第一次GC后 软引用:deep2jvmdvm.SoftReferenceNormal$SoftObject@7b23ec81

[0.142s][info   ][gc] GC(3) Pause Young (Concurrent Start) (G1 Humongous Allocation) 122M->122M(200M) 0.374ms
[0.142s][info   ][gc] GC(4) Concurrent Cycle
[0.142s][info   ][gc] GC(5) Pause Young (Normal) (G1 Humongous Allocation) 122M->122M(200M) 0.333ms
[0.143s][info   ][gc] GC(6) Pause Full (G1 Humongous Allocation) 122M->121M(200M) 1.250ms
[0.151s][info   ][gc] GC(7) Pause Full (G1 Humongous Allocation) 121M->0M(10M) 7.562ms
[0.152s][info   ][gc] GC(4) Concurrent Cycle 10.316ms
    再次配一个120M的强引用对象后 软引用:null

首先通过-Xmx将堆最大内存设置为200M。从日志中可以看出,当第一次GC时,内存中还有剩余可用内存,所以软引用并不会被GC回收。但是当我们再次创建一个120M的强引用时,JVM可用内存已经不够,所以会尝试将软引用给回收掉。

软引用隐藏问题

需要注意的是,被软引用对象关联的对象会自动被垃圾回收器回收,但是软引用对象本身也是一个对象,这些创建的软引用并不会自动被垃圾回收器回收掉。比如如下代码:

public class SoftReferenceTest {
    //软引用隐藏问题
    //需要注意的是,被软引用对象关联的对象会自动被垃圾回收器回收,但是软引用对象本身也是一个对象,
    // 这些创建的软引用并不会自动被垃圾回收器回收掉。比如如下代码:

    static class SoftObject {
        byte[] data = new byte[1024];// 1KB
    }

    public static int removedsoftRefs = 0;

    public static int CACHE_CAPACTIY = 100 * 1024;// 100M

    //静态集合保存软引用,会导致这些软引用本身无法被垃圾回收器回收
    public static Set<SoftReference<SoftObject>> cache = new HashSet<>(CACHE_CAPACTIY);

    public static ReferenceQueue<SoftObject> sReferenceQueue = new ReferenceQueue<>();

    public static void main(String[] args) {

        for (int i = 0; i < CACHE_CAPACTIY; i++) {
            SoftObject softObject = new SoftObject();
            cache.add(new SoftReference<>(softObject, sReferenceQueue));

        

            if (i % 10000 == 0) {
                PrintlnUtils.println("size of cache: " + cache.size());
            }
        }

        PrintlnUtils.println("end!  removedsoftRefs:"+removedsoftRefs);
    }

    public static void clearUselessSoftReference() {
        Reference<? extends SoftObject> reference = sReferenceQueue.poll();
        while (reference != null) {
            if (cache.remove(reference)) {
                removedsoftRefs++;
            }
            reference = sReferenceQueue.poll();
        }
    }

}

上述代码,虽然每一个SoftObject都被一个软引用所引用,在内存紧张时,GC会将SoftObject所占用的1KB回收。但是每一个SoftReference又都被Set所引用(强引用)。执行上述代码结果如下:

 size of cache: 1

    size of cache: 10001


Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "main"

限制堆内存大小为4M,最终程序崩溃,但是异常的原因并不是普通的堆内存溢出,而是"GC overhead"。之所以会抛出这个错误,是由于虚拟机一直在不断回收软引用,回收进行的速度过快,占用的cpu过大(超过98%),并且每次回收掉的内存过小(小于2%),导致最终抛出了这个错误。

这里需要做优化,合适的处理方式是注册一个引用队列,每次循环之后将引用队列中出现的软引用对象从cache中移除。如下所示:

public class SoftReferenceTest {
    //软引用隐藏问题
    //需要注意的是,被软引用对象关联的对象会自动被垃圾回收器回收,但是软引用对象本身也是一个对象,
    // 这些创建的软引用并不会自动被垃圾回收器回收掉。比如如下代码:

    static class SoftObject {
        byte[] data = new byte[1024];// 1KB
    }

    public static int removedsoftRefs = 0;

    public static int CACHE_CAPACTIY = 100 * 1024;// 100M

    //静态集合保存软引用,会导致这些软引用本身无法被垃圾回收器回收
    public static Set<SoftReference<SoftObject>> cache = new HashSet<>(CACHE_CAPACTIY);

    public static ReferenceQueue<SoftObject> sReferenceQueue = new ReferenceQueue<>();

    public static void main(String[] args) {

        for (int i = 0; i < CACHE_CAPACTIY; i++) {
            SoftObject softObject = new SoftObject();
            cache.add(new SoftReference<>(softObject, sReferenceQueue));

            clearUselessSoftReference();

            if (i % 10000 == 0) {
                PrintlnUtils.println("size of cache: " + cache.size());
            }
        }

        PrintlnUtils.println("end!  removedsoftRefs:"+removedsoftRefs);

        //虽然每一个SoftObject都被一个软引用所引用,在内存紧张时,GC会将SoftObject所占用的1KB回收。
        // 但是每一个SoftReference又都被Set所引用(强引用)。执行上述代码结果如下:

        //Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "main"
        //
        //Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "Monitor Ctrl-Break"

        //限制堆内存大小为4M,最终程序崩溃,但是异常的原因并不是普通的堆内存溢出,而是"GC overhead"。之所以会抛出这个错误,是由于虚拟机一直在不断回收软引用,回收进行的速度过快,占用的cpu过大(超过98%),并且每次回收掉的内存过小(小于2%),导致最终抛出了这个错误。
        //
        //这里需要做优化,合适的处理方式是注册一个引用队列,每次循环之后将引用队列中出现的软引用对象从cache中移除。如下所示:
    }

    public static void clearUselessSoftReference() {
        Reference<? extends SoftObject> reference = sReferenceQueue.poll();
        while (reference != null) {
            if (cache.remove(reference)) {
                removedsoftRefs++;
            }
            reference = sReferenceQueue.poll();
        }
    }

}

再次运行修改后的代码,结果如下:

 size of cache: 1

    size of cache: 224

    size of cache: 538

    size of cache: 358

    size of cache: 425

    size of cache: 492

    size of cache: 559

    size of cache: 662

    size of cache: 729

    size of cache: 796

    size of cache: 863

    end!  removedsoftRefs:101847

可以看出优化后,程序可以正常执行完。并且在执行过程中会动态的将集合中的软引用删除。

更多详细 SoftReference 的介绍,可以参考 Java虚拟机究竟是如何处理SoftReference的

总结:

本课时着重讲解了 JVM 中有关垃圾回收的相关知识点,其中重点介绍了使用可达性分析来判断对象是否可以被回收,以及 3 种垃圾回收算法。最后通过分析 GC Log 验证了 Java 虚拟机中内存分配及分代策略的一些细节。

虚拟机垃圾回收机制很多时候都是影响系统性能、并发能力的主要因素之一。尤其是对于从事 Android 开发的工程师来说,有时候垃圾回收会很大程度上影响 UI 线程,并造成界面卡顿现象。因此理解垃圾回收机制并学会分析 GC Log 也是一项必不可少的技能。后续在 DVM 课时中,详细介绍 Android 虚拟机中对垃圾回收所做的优化。

示例代码代码在 LearnJava工程里的src目录下的deep2jvmdvm包里

源码

链接地址:https://gitee.com/benloogchang/LearnJava.git

扩展知识点

IDEA 中 Run/Debug configurations 没有 VM options

欢迎关注我的公众号,不定期推送优质的文章,
微信扫一扫下方二维码即可关注。
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值