JVM垃圾回收算法

慕小容mango

已于 2022-03-22 10:22:58 修改

阅读量207

点赞数

分类专栏： JVM 文章标签： java

于 2021-03-07 10:13:30 首次发布

本文链接：https://blog.csdn.net/ARSCCC/article/details/114478213

版权

JVM 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

本文介绍了Java垃圾回收的基本概念和重要性，详细阐述了垃圾回收的两种主要标记算法——引用计数法和可达性分析法，以及其优缺点。接着，讨论了复制、标记-清除和标记-压缩等三种常见的垃圾回收算法，分析了它们的执行流程、优缺点和适用场景。此外，还提到了对象的finalization机制和软引用、弱引用、虚引用的区别及其作用。最后，探讨了在实际开发中如何选择和理解垃圾回收算法的重要性。

摘要由CSDN通过智能技术生成

1. 概述

JAVA语言相较于C++来说砍掉了指针的概念，实现了垃圾的自动收集等；所以可以把Java语言看做是C++的删减版，就相当于Java = (C++)–；把很多不必要的东西做了简化处理；但是C++可以直接操作内存以及Java可以自动进行垃圾收集都各自拥有着相应的优缺点；

什么是垃圾

垃圾是指在运行程序中没有任何指针指向的对象，这个对象就是需要被回收的垃圾；
如果不及时对内存中的垃圾进行清理，那么，这些垃圾对象所占的内存空间会一直保留到应用程序结束，被保留的空间无法被其他对象使用；甚至可能导致内存溢出（也就是部分内存空间一直被占用但是那些占用该内存空间已经没有用处的情况）；
垃圾收集并不是Java语言的伴生产物；早在1960年，第一门开始使用内存动态分配和垃圾收集技术的Lisp语言就诞生了；
关于垃圾收集有三个经典问题：哪些内存需要回收？什么时候回收？如何回收？
垃圾收集机制是Java的招牌能力，极大地提高了开发效率。如今，垃圾收集几乎成为现代语言的标配，即使经过如此长时间的发展，Java的垃圾收集机制仍然在不断的演进中，不同大小的设备、不同特征的应用场景，对垃圾收集提出了新的挑战，这当然也是面试的热点；注意：垃圾回收的是聚合量；

大厂相关面试题

. 蚂蚁金服
- 你知道哪几种垃圾回收器，各自的优缺点，重点讲一下 CMS和G1；
- JVM GC算法有哪些，目前的JDK版本采用什么回收算法
- 讲一下G1回收器的回收过程；
- GC是什么？为什么要有GC？
- GC的两种判定方法？ CMS收集器与G1收集器的特点；
百度
- 说一下GC算法，分代回收说下；
- 垃圾收集策略和算法；
天猫
- JVM GC原理，JVM怎么回收内存；
- CMS特点，垃圾回收算法有哪些？各自的优缺点，他们共同的缺点是什么？
滴滴
- Java的垃圾回收器都有哪些，说下G1的应用场景，平时你是如何搭配使用垃圾回收器的；
京东
- 你知道哪几种垃圾收集器，各自的优缺点，重点讲下CMS和G1，包括原理，流程，优缺点；垃圾回收算法的实现原理；
阿里
- 讲一讲垃圾回收算法；什么情况下触发垃圾回收；如何选择合适的垃圾收集算法；JVM有哪三种垃圾回收器？
字节跳动
- 常见的垃圾回收器算法有哪些，各有什么优劣；system.gc()和runtime.gc()会做什么事情；Java GC机制？GC Roots有哪些？Java对象的回收方式，回收算法；CMS和G1了解么，CMS解决什么问题，说一下回收的过程；CMS回收停顿了几次，为什么要停顿两次；

为什么需要GC

对于高级语言来说，释放内存的操作并不是由程序员完成的，一个基本认知是如果不进行垃圾回收，内存迟早都会被消耗完，因为不断地分配内存空间而不进行回收，就好像不停地生产生活垃圾而从来不打扫一样；
除了释放没用的对象，垃圾回收也可以清除内存里的记录碎片；碎片整理将所占用的堆内存移到堆的一端，以便JVM将整理出的内存分配给新的对象；
随着应用程序所应付的业务越来越庞大、复杂，用户越来越多，没有GC就不能保证应用程序的正常进行；而经常造成STW的GC又跟不上实际的需求，所以才会不断地尝试对GC进行优化；

早期垃圾回收

在早期的C/C++时代，垃圾回收基本.上是手工进行的；开发人员可以使用 new关键字进行内存申请，并使用delete关键字进行内存释放；比如以下代码：

MibBridge *pBridge = new cmBaseGroupBridge();
//如果注册失败，使用Delete释放该对象所占内存区域
if (pBridge -> Register(kDestroy) != NO_ERROR)
delete pBridge;

这种方式可以灵活控制内存释放的时间，但是会给开发人员带来频繁申请和释放内存的管理负担。倘若有一处内存区间由于程序员编码的问题忘记被回收，那么就会产生内存泄漏，垃圾对象永远无法被清除，随着系统运行时间的不断增长，垃圾对象所耗内存可能持续上升，直到出现内存溢出并造成应用程序崩溃；
在有了垃圾回收机制后，上述代码块极有可能变成这样：

MibBridge *pBridge = new cmBaseGroupBridge();
//如果注册失败，使用Delete释放该对象所占内存区域
pBridge -> Register(kDestroy) != NO_ERROR;

现在，除了Java以外，C#、Python、 Ruby等语言都使用了自动垃圾回收的思想，也是未来发展趋势;可以说，这种自动化的内存分配和垃圾回收的方式己经成为现代开发语言必备的标准;

Java垃圾回收机制

自动内存管理，无需开发人员手动参与内存的分配与回收，这样降低内存泄漏和内存溢出的风险；如果没有垃圾回收器，java也会和cpp一样，各种悬垂指针，野指针，泄露问题让你头疼不已；
自动内存管理机制，将程序员从繁重的内存管理中释放出来，可以更专心地专注于业务开发；
对于Java开发人员而言，自动内存管理就像是一个黑匣子，如果过度依赖于 “自动”，那么这将会是一场灾难，最严重的就会弱化Java开发人员在程序出现内存溢出时定位问题和解决问题的能力；
此时，了解JVM的自动内存分配和内存回收原理就显得非常重要，只有在真正了解JVM是如何管理内存后，我们才能够在遇见OutOfMemoryError时，快速地根据错误异常日志定位问题和解决问题；
当需要排查各种内存溢出、内存泄漏问题时，当垃圾收集成为系统达到更高并发量的瓶颈时，我们就必须对这些“自动化”的技术实施必要的监控和调节；
垃圾回收器可以对年轻代回收，也可以对老年代回收，甚至是全堆和方法区的回收；其中，Java堆是垃圾收集器的工作重点（Java垃圾回收的对象是方法区和堆）；
从次数上讲：频繁收集Young区；较少收集Old区；基本不动Perm区；

2. 垃圾回收相关算法

垃圾标记阶段:对象存活判断

在堆里存放着几乎所有的Java对象实例，在GC执行垃圾回收之前，首先需要区分出内存中哪些是存活对象，哪些是已经死亡的对象；只有被标记为己经死亡的对象，GC才会在执行垃圾回收时，释放掉其所占用的内存空间，因此这个过程我们可以称为垃圾标记阶段；
那么在JVM中究竟是如何标记一个死亡对象呢？简单来说，当一个对象已经不再被任何的存活对象继续引用时，就可以宣判为已经死亡；
判断对象存活一般有两种方式：引用计数算法和可达性分析算法；

2.1 标记阶段:法1_引用计数法 (Java没有采用)

引用计数算法（Reference Counting）比较简单，对每个对象保存一个整型的引用计数器属性，用于记录对象被引用的情况；
对于一个对象A，只要有任何一个对象引用了A，则A的引用计数器就加1；当引用失效时，引用计数器就减1；只要对象A的引用计数器的值为0，即表示对象A不可能再被使用，可进行回收；
优点：实现简单，垃圾对象便于辨识；判定效率高，回收没有延迟性；
缺点：它需要单独的字段存储计数器，这样的做法增加了存储空间的开销；每次赋值都需要更新计数器，伴随着加法和减法操作，这增加了时间开销；引用计数器有一个严重的问题，即无法处理循环引用的情况；这是一条致命缺陷，导致在Java的垃圾回收器中没有使用这类算法

图示分析证明java没有采用引用计数法：

如果不下小心直接把Obj1-reference和Obj2-reference置null，则在Java堆当中的两块内存依然保持着互相引用，无法回收；

/**
 * -XX:+PrintGCDetails
 * 证明：java使用的不是引用计数算法
 */
public class RefCountGC {
    //这个成员属性唯一的作用就是占用一点内存
    private byte[] bigSize = new byte[5 * 1024 * 1024];//5MB

    Object reference = null;

    public static void main(String[] args) {
        RefCountGC obj1 = new RefCountGC();
        RefCountGC obj2 = new RefCountGC();

        obj1.reference = obj2;
        obj2.reference = obj1;

        obj1 = null;
        obj2 = null;
        //显式的执行垃圾回收行为
        //这里发生GC，obj1和obj2能否被回收? (可以)
        System.gc();

        try {
            Thread.sleep(1000000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

引用计数算法是很多语言的资源回收选择，例如因人工智能而更加火热的Python，它更是同时支持引用计数和垃圾收集机制；
具体哪种最优是要看场景的，业界有大规模实践中仅保留引用计数机制，以提高吞吐量的尝试；
Java并没有选择引用计数，是因为其存在一个基本的难题，也就是很难处理循环引用关系；
Python 如何解决循环引用？
- 手动解除：很好理解，就是在合适的时机，解除引用关系；
- 使用弱引用weakref，weakref是Python提供的标准库，旨在解决循环引用；

2.2 标记阶段:法2_可达性分析算法

相对于引用计数算法而言，可达性分析算法不仅同样具备实现简单和执行高效等特点，更重要的是该算法可以有效地解决在引用计数算法中循环引用的问题，防止内存泄漏的发生；
相较于引用计数算法，这里的可达性分析就是Java、C#选择的。这种类型的垃圾收集通常也叫作追踪性垃圾收集（Tracing GarbageCollection）；
所谓"GC Roots"根集合就是一组必须活跃的引用；
基本思路：
- 可达性分析算法是以根对象集合(GCRoots）为起始点，按照从上至下的方式搜索被根对象集合所连接的目标对象是否可达；
- 使用可达性分析算法后，内存中的存活对象都会被根对象集合直接或间接连接着，搜索所走过的路径称为引用链（Reference Chain）；
- 如果目标对象没有任何引用链相连，则是不可达的，就意味着该对象己经死亡，可以标记为垃圾对象；
- 在可达性分析算法中，只有能够被根对象集合直接或者间接连接的对象才是存活对象；

在Java语言中，GC Roots包括以下几类元素：

虚拟机栈中引用的对象，比如：各个线程被调用的方法中使用到的参数、局部变量等；
本地方法栈内JNI（通常说的本地方法）引用的对象；
方法区中类静态属性引用的对象，比如：Java类的引用类型静态变量；
方法区中常量引用的对象，比如：字符串常量池（string Table）里的引用；
所有被同步锁synchronized持有的对象；
Java虚拟机内部的引用，基本数据类型对应的Class对象，一些常驻的异常对象（如： NullPointerException、OutOfMemoryError），系统类加载器；
反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等；
除了这些固定的GCRoots集合以外，根据用户所选用的垃圾收集器以及当前回收的内存区域不同，还可以有其他对象“临时性”地加入，共同构成完整GC Roots集合。比如：分代收集和局部回收（Partial GC）；如果只针对Java堆中的某一块区域进行垃圾回收（比如：典型的只针
对新生代），必须考虑到内存区域是虚拟机自己的实现细节，而不是孤立封闭的，这个区域的对象完全有可能被其他区域的对象所引用，这时候就需要一并将关联的区域对象也加入GC Roots集合中去考虑，才能保证可达性分析的准确性；
小技巧：由于Root采用栈方式存放变量和指针，所以如果一个指针，它保存了堆内存里面的对象，但是自己又不存放在堆内存里面，那它就是一个Root；
如果要使用可达性分析算法来判断内存是否可回收，那么分析工作必须在一个能保障一致性的快照中进行；这点不满足的话分析结果的准确性就无法保证；
这点也是导致GC进行时必须"StopTheWorld"的一个重要原因（就比如有人帮你打扫卫生，你不能在他们打扫卫生的时候同时有制造垃圾）；即使是号称（几乎）不会发生停顿的CMS收集器中，枚举根节点时也是必须要停顿的；

2.3 对象的finalization机制

Java语言提供了对象终止（finalization）机制来允许开发人员提供对象被销毁之前的自定义处理逻辑；
当垃圾回收器发现没有引用指向一个对象，即：垃圾回收此对象之前，总会先调用这个对象的finalize()方法;
finalize()方法允许在子类中被重写，用于在对象被回收时进行资源释放，通常在这个方法中进行一些资源释放和清理的工作，比如关闭文件、套接字和数据库连接等；
应该交给垃圾回收机制调用；理由包括下面三点：永远不要主动调用某个对象的finalize()方法；因为在finalize()时可能会导致对象复活；finalize()方法的执行时间是没有保障的，它完全由GC线程决定，极端情况下，若不发生GC，则finalize()方法将没有执行机会；一个糟糕的finalize()会严重影响GC的性能；
从功能上来说，finalize()方法与C++ 中的析构函数比较相似，但是Java采用的是基于垃圾回收器的自动内存管理机制，所以finalize()方法在本质，上不同于C++ 中的析构函数；
由于finalize()方法的存在，虚拟机中的对象一般处于三种可能的状态；
如果从所有的根节点都无法访问到某个对象，说明对象己经不再使用了。一般来说，此对象需要被回收。但事实上，也并非是“非死不可”的，这时候它们暂时处于“缓刑”阶段。一个无法触及的对象有可能在某一个条件下“复活”自己，如果这样，那么对它的回收就是不合理的，为此，定义虚拟机中的对象可能的三种状态。如下：
- 可触及的：从根节点开始，可以到达这个对象；
- 可复活的：对象的所有引用都被释放，但是对象有可能在finalize()中复活;
- 不可触及的：对象的finalize()被调用，并且没有复活，那么就会进入不可触及状态;不可触及的对象不可能被复活，因为finalize()只会被调用一次;
- 以上3种状态中，是由于finalize()方法的存在而进行的区分；只有在对象不可触及时才可以被回收；判定一个对象objA是否可回收，至少要经历两次标记过程：如果对象objA到GC Roots没有引用链，则进行第一次标记；进行筛选，判断此对象是否有必要执行finalize()方法；如果对象objA没有重写finalize()方法，或者finalize()方法已经被虚拟机调用过，则虚拟机视为“没有必要执行”，objA被判定为不可触及的；如果对象objA重写了finalize()方法，且还未执行过，那么objA会被插入到F-Queue队列中，由一个虚拟机自动创建的、低优先级的Finalizer线程触发其finalize()方法执行；finalize()方法是对象逃脱死亡的最后机会，稍后GC会对F-Queue队列中的对象进行第二次标记，如果objA在finalize()方法中与引用链上的任何一个对象建立了联系，那么在第二次标记时，objA会被移出“即将回收”集合，之后，对象会再次出现没有引用存在的情况，在这个情况下，finalize方法不会被再次调用，对象会直接变成不可触及的状态，也就是说，一个对象的finalize方法只会被调用一次；

代码测试可复活的对象

/**
 * 测试Object类中finalize()方法，即对象的finalization机制。
 *
 */
public class CanReliveObj {
    public static CanReliveObj obj;//类变量，属于 GC Root


    //此方法只能被调用一次
    @Override
    protected void finalize() throws Throwable {
        super.finalize();
        System.out.println("调用当前类重写的finalize()方法");
        obj = this;//当前待回收的对象在finalize()方法中与引用链上的一个对象obj建立了联系
    }


    public static void main(String[] args) {
        try {
            obj = new CanReliveObj();
            // 对象第一次成功拯救自己
            obj = null;
            System.gc();//调用垃圾回收器
            System.out.println("第1次 gc");
            // 因为Finalizer线程优先级很低，暂停2秒，以等待它
            Thread.sleep(2000);
            if (obj == null) {
                System.out.println("obj is dead");
            } else {
                System.out.println("obj is still alive");
            }
            System.out.println("第2次 gc");
            // 下面这段代码与上面的完全相同，但是这次自救却失败了
            obj = null;
            System.gc();
            // 因为Finalizer线程优先级很低，暂停2秒，以等待它
            Thread.sleep(2000);
            if (obj == null) {
                System.out.println("obj is dead");
            } else {
                System.out.println("obj is still alive");
            }
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

第1次 gc
调用当前类重写的finalize()方法
obj is still alive
第2次 gc
obj is dead

2.4 MAT与JProfiler的GC Roots溯源

MAT是Memory Analyzer的简称，它是一款功能强大的Java堆内存分析器。用于查找内存泄漏以及查看内存消耗情况；
MAT是基于Eclipse开发的，是一款免费的性能分析工具；可以在http://www.eclipse org/mat/下载并使用MAT；

获取dump文件

方式1: 命令行使用jmap
- jps
- jmap -dump:format=b,live,file=test1.bin {进程id}
方式2：使用JVisualVM导出
- 捕获的heap dump文件是一个临时文件，关闭JVisualVM后自动删除，若要保留，需要将其另存为文件；
- 可通过以下方法捕获heap dump：在左侧“Application”（应用程序）子窗口中右击相应的应用程序，选择Heap Dump（堆Dump）；在Monitor （监视）子标签页中点击Heap Dump （堆Dump）按钮；
本地应用程序的Heap dumps作为应用程序标签页的一个子标签页打开。同时， heap dump在左侧的Application （应用程序）栏中对应一个含有时间戳的节点。右击这个节点选择save as （另存为）即可将heap dump保存到本地；

GC Roots分析

public class GCRootsTest {
    public static void main(String[] args) {
        List<Object> numList = new ArrayList<>();
        Date birth = new Date();

        for (int i = 0; i < 100; i++) {
            numList.add(String.valueOf(i));
            try {
                Thread.sleep(10);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }

        System.out.println("数据添加完毕，请操作：");
        new Scanner(System.in).next();
        numList = null;
        birth = null;

        System.out.println("numList、birth已置空，请操作：");
        new Scanner(System.in).next();

        System.out.println("结束");
    }
}

使用MAT查看GC Roots
在这里插入图片描述
使用jProfiler进行GC溯源

使用Jprofiler分析OOM

/**
 * -Xms8m -Xmx8m -XX:+HeapDumpOnOutOfMemoryError
 *
 */
public class HeapOOM {
    byte[] buffer = new byte[1 * 1024 * 1024];//1MB

    public static void main(String[] args) {
        ArrayList<HeapOOM> list = new ArrayList<>();

        int count = 0;
        try{
            while(true){
                list.add(new HeapOOM());
                count++;
            }
        }catch (Throwable e){
            System.out.println("count = " + count);
            e.printStackTrace();
        }
    }
}

控制台输出：

java.lang.OutOfMemoryError: Java heap space
Dumping heap to java_pid45386.hprof ...
Heap dump file created [7390812 bytes in 0.019 secs]
count = 6
java.lang.OutOfMemoryError: Java heap space
	at com.dsh.jvm.gc.algorithm.HeapOOM.<init>(HeapOOM.java:12)
	at com.dsh.jvm.gc.algorithm.HeapOOM.main(HeapOOM.java:20)

对应count=6
在这里插入图片描述
出现OOM的代码

2.5 清除阶段:法1_标记-清除算法

当成功区分出内存中存活对象和死亡对象后，GC接下来的任务就是执行垃圾回收，释放掉无用对象所占用的内存空间，以便有足够的可用内存空间为新对象分配内存，目前在JVM中比较常见的三种垃圾收集算法是标记-清除算法（ Mark-Sweep）、复制算法（Copying）、标记-压缩算法（Mark-Compact）；

背景

标记-清除算法（Mark-Sweep）是一种非常基础和常见的垃圾收集算法，该算法被J.McCarthy等人在1960年提出并并应用于Lisp语言;

执行流程

当堆中的有效内存空间（available memory）被耗尽的时候，就会停止整个程序（也被称为stop the world），然后进行两项工作，第一项则是标记，第二项则是清除。

标记：Collector从引用根节点开始遍历，标记所有被引用的对象；一般是在对象的Header中记录为可达对象；
清除：Collector对堆内存从头到尾进行线性的遍历，如果发现某个对象在其Header中没有标记为可达对象，则将其回收；

缺点

效率不算高；在进行GC的时候，需要停止整个应用程序，导致用户体验差；这种方式清理出来的空闲内存是不连续的，产生内存碎片；需要维护一个空闲列表；

注意：何为清除？

这里所谓的清除并不是真的置空，而是把需要清除的对象地址保存在空闲的地址列表里；下次有新对象需要加载时，判断垃圾的位置空间是否够，如果够的话，就将新对象存放在相应的地址中；

2.6 清除阶段:法2_复制算法

背景

为了解决标记一清除算法在垃圾收集效率方面的缺陷，M.L.Minsky于1963年发表了著名的论文，“ 使用双存储区的Li sp语言垃圾收集器CALISP Garbage Collector Algorithm Using SerialSecondary Storage ）”。M.L. Minsky在该论文中描述的算法被人们称为复制（Copying）算法，它也被M. L.Minsky本人成功地引入到了Lisp语言的一个实现版本中；

核心思想

将活着的内存空间分为两块，每次只使用其中一块，在垃圾回收时将正在使用的内存中的存活对象复制到未被使用的内存块中，之后清除正在使用的内存块中的所有对象，交换两个内存的角色，最后完成垃圾回收，堆中S0和S1使用的就是复制算法；

优点

没有标记和清除过程，实现简单，运行高效；
复制过去以后保证空间的连续性，不会出现“碎片”问题；

缺点

此算法的缺点也是很明显的，就是需要两倍的内存空间；
对于G1这种分拆成为大量region的GC，复制而不是移动，意味着GC需要维护region之间对象引用关系，不管是内存占用或者时间开销也不小；特别的如果系统中的垃圾对象很多，复制算法不会很理想,复制算法需要复制的存活对象数量并不会太大，或者说非常低才行；

应用场景

在新生代，对常规应用的垃圾回收，一次通常可以回收70%-99%的内存空间，回收性价比很高；所以现在的商业虚拟机都是用这种收集算法回收新生代；

2.7 清除阶段:法3_标记-压缩(整理,Mark-Compact)算法

背景

复制算法的高效性是建立在存活对象少、垃圾对象多的前提下的。这种情况在新生代经常发生，但是在老年代，更常见的情况是大部分对象都是存活对象。如果依然使用复制算法，由于存活对象较多，复制的成本也将很高。因此，基于老年代垃圾回收的特性，需要使用其他的算法。标记一清除算法的确可以应用在老年代中，但是该算法不仅执行效率低下，而且在执行完内存回收后还会产生内存碎片，所以JVM的设计者需要在此基础之上进行改进。标记一压缩（Mark一Compact）算法由此诞生。1970年前后，G. L. Steele 、C. J. Chene和D.S. Wise 等研究者发布标记一压缩算法。在许多现代的垃圾收集器中，人们都使用了标记一压缩算法或其改进版本；

执行过程

第一阶段和标记一清除算法一样，从根节点开始标记所有被引用对象；
第二阶段将所有的存活对象压缩到内存的一端，按顺序排放；
之后，清理边界外所有的空间；
标记一压缩算法的最终效果等同于标记一清除算法执行完成后，再进行一次内存碎片整理，因此，也可以把它称为标记-清除-压缩（Mark-Sweep-Compact）算法；
二者的本质差异在于标记-清除算法是一种非移动式的回收算法，标记-压缩是移动式的；是否移动回收后的存活对象是一项优缺点并存的风险决策；
可以看到，标记的存活对象将会被整理，按照内存地址依次排列，而未被标记的内存会被清理掉。如此一来，当我们需要给新对象分配内存时，JVM只需要持有一个内存的起始地址即可，这比维护一个空闲列表显然少了许多开销；

优点

消除了标记一清除算法当中，内存区域分散的缺点，我们需要给新对象分配内存时，JVM只需要持有一个内存的起始地址即可；
消除了复制算法当中，内存减半的高额代价；

缺点

从效率上来说，标记一整理算法要低于复制算法；
移动对象的同时，如果对象被其他对象引用，则还需要调整引用的地址，移动过程中，需要全程暂停用户应用程序，即STW；

2.8 小结

效率上来说，复制算法是当之无愧的老大，但是却浪费了太多内存；
而为了尽量兼顾上面提到的三个指标，标记一整理算法相对来说更平滑一些，但是效率上不尽如人意，它比复制算法多了一个标记的阶段，比标记一清除多了一个整理内存的阶段；

	Mark-Sweep	Mark-Compact	Copying
速度	中等	最慢	最快
空间开销	少(但是会产生内部碎片)	少(不会产生内部碎片)	通常需要活对象的两倍大小(不堆积碎片)
移动对象	否	是	是

3. 有关引用的补充

我们希望能描述这样一类对象：当内存空间还足够时，则能保留在内存中；如果内存空间在进行垃圾收集后还是很紧张，则可以抛弃这些对象。 -【既偏门又非常高频的面试题】强引用、软引用、弱引用、虚引用有什么区别？具体使用场景是什么？
在JDK 1.2版之后，Java对引用的概念进行了扩充，将引用分为强引用（Strong
Reference）、软引用（Soft Reference）、弱引用（Weak Reference）和虚引用（Phantom Reference）4种，这4种引用强度依次逐渐减弱；
除强引用外，其他3种引用均可以在java.lang.ref包中找到它们的身影。如下图，显示了这3种引用类型对应的类，开发人员可以在应用程序中直接使用它们；
Reference子类中只有终结器引用是包内可见的，其他3种引用类型均为public，可以在应用程序中直接使用；
强引用（StrongReference）：最传统的“引用”的定义，是指在程序代码之中普遍存在的引用赋值，即类似“0bject obj = new object()”这种引用关系。无论任何情况下，只要强引用关系还存在，垃圾收集器就永远不会回收掉被引用的对象；
软引用（SoftReference）：在系统将要发生内存溢出之前，将会把这些对象列入回收范围之中进行第二次回收。如果这次回收后还没有足够的内存，才会抛出内存溢出异常;
弱引用（WeakReference）：被弱引用关联的对象只能生存到下一次垃圾收集之前。当垃圾收集器工作时，无论内存空间是否足够，都会回收掉被弱引用关联的对象；
虚引用（PhantomReference）：一个对象是否有虚引用的存在，完全不会对其生存时间构成影响，也无法通过虚引用来获得一个对象的实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知(回收跟踪)；

强引用: 不回收

在Java程序中，最常见的引用类型是强引用（普通系统99%以上都是强引用），也就是我们最常见的普通对象引用，也是默认的引用类型；
当在Java语言中使用new操作符创建一个新的对象，并将其赋值给一个变量的时候，这个变量就成为指向该对象的一个强引用；
强引用的对象是可触及的，垃圾收集器就永远不会回收掉被引用的对象；
对于一个普通的对象，如果没有其他的引用关系，只要超过了引用的作用域或者显式地将相应（强）引用赋值为null，就是可以当做垃圾被收集了，当然具体回收时机还是要看垃圾收集策略；
相对的，软引用、弱引用和虚引用的对象是软可触及、弱可触及和虛可触及的，在一定条件下，都是可以被回收的。所以，强引用是造成Java内存泄漏的主要原因之一；

测试代码

public class StrongReferenceTest {
    public static void main(String[] args) {
        StringBuffer str = new StringBuffer ("Hello,尚硅谷");
        StringBuffer str1 = str;

        str = null;
        System.gc();

        try {
            Thread.sleep(3000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        System.out.println(str1);
    }
}

局部变量str指向StringBuffer实例所在堆空间，通过str可以操作该实例，那么str就是StringBuffer实例的强引用，对应内存结构：
此时如果再运行一个赋值语句，则对应的内存结构为：

本例中的两个引用，都是强引用，强引用具备以下特点：

强引用可以直接访问目标对象；
强引用所指向的对象在任何时候都不会被系统回收，虚拟机宁愿抛出OOM异常，也不会回收强引用所指向对象；
强引用可能导致内存泄漏；

软引用: 内存不足即回收

软引用是用来描述一些还有用，但非必需的对象。只被软引用关联着的对象，在系统将要发生内存溢出异常前，会把这些对象列进回收范围之中进行第二次回收，如果这次回收还没有足够的内存，才会抛出内存溢出异常；
软引用通常用来实现内存敏感的缓存。比如：高速缓存就有用到软引用。如果还有空闲内存，就可以暂时保留缓存，当内存不足时清理掉，这样就保证了使用缓存的同时，不会耗尽内存；
垃圾回收器在某个时刻决定回收软可达的对象的时候，会清理软引用，并可选地把引用存放到一个引用队列（ Reference Queue）；
类似弱引用，只不过Java虚拟机会尽量让软引用的存活时间长一些，迫不得已才清理；
软引用当内存足够时不会回收软引用的可达对象；当内存不够时会回收软引用的可达对象；
在JDK 1. 2版之后提供了java.lang.ref.SoftReference类来实现软引用；

Object obj = new object（）； //声明强引用
SoftReference<0bject> sf = new SoftReference<0bject>（obj）；
obj = null； //销毁强引用

测试代码：

/**
 * 软引用的测试：内存不足即回收
 * -Xms10m -Xmx10m -XX:+PrintGCDetails
 */
public class SoftReferenceTest {
    public static class User {
        public User(int id, String name) {
            this.id = id;
            this.name = name;
        }

        public int id;
        public String name;

        @Override
        public String toString() {
            return "[id=" + id + ", name=" + name + "] ";
        }
    }

    public static void main(String[] args) {
        //创建对象，建立软引用
//        SoftReference<User> userSoftRef = new SoftReference<User>(new User(1, "songhk"));
        //上面的一行代码，等价于如下的三行代码
        User u1 = new User(1,"songhk");
        SoftReference<User> userSoftRef = new SoftReference<User>(u1);
        u1 = null;//取消强引用


        //从软引用中重新获得强引用对象
        System.out.println(userSoftRef.get());

        System.gc();
        System.out.println("After GC:");
//        //垃圾回收之后获得软引用中的对象
        System.out.println(userSoftRef.get());//由于堆空间内存足够，所有不会回收软引用的可达对象。
//
        try {
            //让系统认为内存资源紧张、不够
//            byte[] b = new byte[1024 * 1024 * 7];
            byte[] b = new byte[1024 * 7168 - 399 * 1024];//恰好能放下数组又放不下u1的内存分配大小 不会报OOM
        } catch (Throwable e) {
            e.printStackTrace();
        } finally {
            //再次从软引用中获取数据
            System.out.println(userSoftRef.get());//在报OOM之前，垃圾回收器会回收软引用的可达对象。
        }
    }
}

在这里插入图片描述

弱引用: 发现即回收

弱引用也是用来描述那些非必需对象，被弱引用关联的对象只能生存到下一次垃圾收集发生为止。在系统GC时，只要发现弱引用，不管系统堆空间使用是否充足，都会回收掉只被弱引用关联的对象；
但是，由于垃圾回收器的线程通常优先级很低，因此，并不一定能很快地发现持有弱引用的对象。在这种情况下，弱引用对象可以存在较长的时间；
弱引用和软引用一样，在构造弱引用时，也可以指定一个引用队列，当弱引用对象被回收时，就会加入指定的引用队列，通过这个队列可以跟踪对象的回收情况；
软引用、弱引用都非常适合来保存那些可有可无的缓存数据。如果这么做，当系统内存不足时，这些缓存数据会被回收，不会导致内存溢出。而当内存资源充足时，这些缓存数据又可以存在相当长的时间，从而起到加速系统的作用；
在JDK1.2版之后提后了java.lang.ref.WeakReference类来实现弱引用；

Object obj = new object（）； //声明强引用
WeakReference<0bject> sf = new WeakReference<0bject>（obj）；
obj = null； //销毁强引用

弱引用对象与软引用对象的最大不同就在于，当GC在进行回收时，需要通过算法检查是否回收软引用对象，而对于弱引用对象，GC总是进行回收。弱引用对象更容易、更快被GC回收；
面试题：你开发中使用过WeakHashMap吗？通过查看WeakHashMap源码,可以看到其内部类Entry使用的就是弱引用；line 702：

private static class Entry<K,V> extends WeakReference<Object> implements Map.Entry<K,V> {...}

测试代码

public class WeakReferenceTest {
    public static class User {
        public User(int id, String name) {
            this.id = id;
            this.name = name;
        }

        public int id;
        public String name;

        @Override
        public String toString() {
            return "[id=" + id + ", name=" + name + "] ";
        }
    }

    public static void main(String[] args) {
        //构造了弱引用
        WeakReference<User> userWeakRef = new WeakReference<User>(new User(1, "songhk"));
        //从弱引用中重新获取对象
        System.out.println(userWeakRef.get());

        System.gc();
        // 不管当前内存空间足够与否，都会回收它的内存
        System.out.println("After GC:");
        //重新尝试从弱引用中获取对象
        System.out.println(userWeakRef.get());
    }
}

在这里插入图片描述

虚引用: 对象回收跟踪

虚引用(Phantom Reference),也称为“幽灵引用”或者“幻影引用”，是所有引用类型中最弱的一个
一个对象是否有虚引用的存在，完全不会决定对象的生命周期。如果一个对象仅持有虚引用，那么它和没有引用几乎是一样的，随时都可能被垃圾回收器回收；
它不能单独使用，也无法通过虚引用来获取被引用的对象。当试图通过虚引用的get（）方法取得对象时，总是null；
为一个对象设置虚引用关联的唯一目的在于跟踪垃圾回收过程。比如：能在这个对象被收集器回收时收到一个系统通知；
为一个对象设置虚引用关联的唯一目的在于跟踪垃圾回收过程。比如：能在这个对象被收集器回收时收到一个系统通知；
虚引用必须和引用队列一起使用。虚引用在创建时必须提供一个引用队列作为参数。当垃圾回收器准备回收一个对象时，如果发现它还有虚引用，就会在回收对象后，将这个虚引用加入引用队列，以通知应用程序对象的回收情况；
由于虚引用可以跟踪对象的回收时间，因此，也可以将一些资源释放操作放置在虚引用中执行和记录；
在JDK 1. 2版之后提供了PhantomReference类来实现虚引用；

object obj = new object();
ReferenceQueuephantomQueue = new ReferenceQueue();
PhantomReference<object> pf = new PhantomReference<object>(obj, phantomQueue); 
obj = null;

测试代码

public class PhantomReferenceTest {
    public static PhantomReferenceTest obj;//当前类对象的声明
    static ReferenceQueue<PhantomReferenceTest> phantomQueue = null;//引用队列

    public static class CheckRefQueue extends Thread {
        @Override
        public void run() {
            while (true) {
                if (phantomQueue != null) {
                    PhantomReference<PhantomReferenceTest> objt = null;
                    try {
                        objt = (PhantomReference<PhantomReferenceTest>) phantomQueue.remove();
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                    if (objt != null) {
                        System.out.println("追踪垃圾回收过程：PhantomReferenceTest实例被GC了");
                    }
                }
            }
        }
    }

    @Override
    protected void finalize() throws Throwable { //finalize()方法只能被调用一次！
        super.finalize();
        System.out.println("调用当前类的finalize()方法");
        obj = this;
    }

    public static void main(String[] args) {
        Thread t = new CheckRefQueue();
        t.setDaemon(true);//设置为守护线程：当程序中没有非守护线程时，守护线程也就执行结束。
        t.start();

        phantomQueue = new ReferenceQueue<PhantomReferenceTest>();
        obj = new PhantomReferenceTest();
        //构造了 PhantomReferenceTest 对象的虚引用，并指定了引用队列
        PhantomReference<PhantomReferenceTest> phantomRef = new PhantomReference<PhantomReferenceTest>(obj, phantomQueue);

        try {
            //不可获取虚引用中的对象
            System.out.println(phantomRef.get());

            //将强引用去除
            obj = null;
            //第一次进行GC,由于对象可复活，GC无法回收该对象
            System.gc();
            Thread.sleep(1000);
            if (obj == null) {
                System.out.println("obj 是 null");
            } else {
                System.out.println("obj 可用");
            }
            System.out.println("第 2 次 gc");
            obj = null;
            System.gc(); //一旦将obj对象回收，就会将此虚引用存放到引用队列中。
            Thread.sleep(1000);
            if (obj == null) {
                System.out.println("obj 是 null");
            } else {
                System.out.println("obj 可用");
            }
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

输出：

null
调用当前类的finalize()方法
obj 可用
第 2 次 gc
追踪垃圾回收过程：PhantomReferenceTest实例被GC了
obj 是 null

终接器引用

它用以实现对象的finalize()方法，也可以称为终结器引用；
无需手动编码，其内部配合引用队列使用；
在GC时，终结器引用入队。由Finalizer线程通过终结器引用找到被引用对象并调用它的finalize()方法，第二次GC时才能回收被引用对象；

慕小容mango

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JVM垃圾回收算法

文章目录

1. 概述

什么是垃圾

大厂相关面试题

为什么需要GC

早期垃圾回收

Java垃圾回收机制

2. 垃圾回收相关算法

垃圾标记阶段:对象存活判断

2.1 标记阶段:法1_引用计数法 (Java没有采用)

2.2 标记阶段:法2_可达性分析算法

2.3 对象的finalization机制

2.4 MAT与JProfiler的GC Roots溯源

2.5 清除阶段:法1_标记-清除算法

背景

执行流程

缺点

2.6 清除阶段:法2_复制算法

背景

核心思想

优点

缺点

应用场景

2.7 清除阶段:法3_标记-压缩(整理,Mark-Compact)算法

背景

执行过程

优点

缺点

2.8 小结

3. 有关引用的补充

强引用: 不回收

软引用: 内存不足即回收

弱引用: 发现即回收

虚引用: 对象回收跟踪

终接器引用