读深入理解JVM（2）--垃圾回收

最新推荐文章于 2024-04-08 12:34:41 发布

置顶范慢慢

最新推荐文章于 2024-04-08 12:34:41 发布

阅读量107

点赞数

分类专栏：深入理解JVM java 文章标签：深入理解JVM

本文链接：https://blog.csdn.net/qq_39309096/article/details/115631852

版权

java 同时被 2 个专栏收录

21 篇文章 0 订阅

订阅专栏

深入理解JVM

2 篇文章 0 订阅

订阅专栏

深入理解JVM（2）

对象存活判断算法

引用计数法

给对象添加一个引用计数器，每当有一个地方引用它时，计数器值就加1；

当引用失效时，计数器就减1；

任何时刻计数器都为0的对象就是不可能再被使用的。

问题：很难解决对象之间的互相循环引用的问题。

可达性分析算法

通过一系列名为“GC Roots”的对象作为起始点，从这些节点开始向下搜索，搜索所走过的路径称为引用链（Reference Chain），当一个对象到GC Roots没有任何引用链相连（从GC Roots到这个对象不可达），则证明此对象是不可用的。

在java中，可作为GC Roots的对象包括下面几种：

虚拟机栈（栈帧中的本地变量表）中的引用的对象。
方法区中的类静态属性引用的对象
方法区中的常量引用的对象
本地方法栈中JNI（java native interface）的引用的对象

引用类型

引用分为：强引用、软引用、弱引用、虚引用。

强引用：类似“Object obj = new Object()”，只要强引用还存在，垃圾收集器永远不会回收掉被引用的对象。
软引用：描述一些还有用，单并非必需的对象。在系统将要发出内存溢出异常之前，将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还没有足够的内存，才会抛出内存溢出异常。
弱引用：描述非必需对象，强度比软引用更弱一些。被弱引用关联的对象只能生存到下一次垃圾收集发生之前，当垃圾收集器工作时，无论内存是否足够，都会回收掉纸杯弱引用关联的对象。
虚引用：最弱的引用关系。一个对象是否有虚引用的存在，完全不会对其生存时间构成影响，也无法通过虚引用来取得一个对象实例。（为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被收集器回收时收到一个系统通知）

生存 or 死亡？

宣告一个对象死亡，至少经历两次标记过程：

1、如果对象在进行可达性算法搜索后，发现没有与GC Roots相连接的引用链，那它将会被标记并进行第一次筛选，筛选的条件是此对象是否有必要执行finalize() 方法。当对象没有重写finalize()方法，或者finalize()方法已经被虚拟机调用过，虚拟机都会视为“没有必要执行”。

2、如果这个对象被判定为有必要执行finalize()方法，那么这个对象会被放到一个叫F-Queue的队列中，并在稍后由一条由虚拟机自动建立的、低优先级的Finalizer的线程去执行。虚拟机会触发这个方法但是并不会保证会等待它运行结束（如果一个对象在finalize()中执行缓慢，或者发生死循环，将会导致F-Queue队列中的其他对象永久处于等待状态，导致整个内存崩溃）。

finalize()是对象逃脱死亡的最后一次机会，稍后GC将对F-Queue中的对象进行第二次小规模标记，如果对象要在finalize()中成功拯救自己（只要重新与引用链上的任何一个对象建立关联即可），那么在第二次标记时它将被移除“即将回收”的集合。

注意：任何对象的finalize()只会被系统自动调用一次。

会执行finalize()方法。

public class FinalizeGc {

    public static FinalizeGc SAVE = null;

    public void isAlive(){

        System.out.println("I am alive");

    }

    public void finalize() throws Throwable{

        super.finalize();

        System.out.println("finalize executed");

        FinalizeGc.SAVE = this;

    }

    public static void main(String[] args) throws InterruptedException {

        SAVE = new FinalizeGc();

        SAVE = null;

        System.gc();

        Thread.sleep(500);

        if (SAVE != null){

            SAVE.isAlive();

        } else {

            System.out.println("dead");

        }

        SAVE = null;

        System.gc();

        Thread.sleep(500);

        if (SAVE != null){

            SAVE.isAlive();

        } else {

            System.out.println("dead");

        }

    }

}


finalize executed

I am alive

dead

不会执行finalize()方法。

public class FinalizeGc {

    public static FinalizeGc SAVE = null;

    public void isAlive(){

        System.out.println("I am alive");

    }

    public void finalize() throws Throwable{

        super.finalize();

        System.out.println("finalize executed");

        Thread.sleep(5000);

        FinalizeGc.SAVE = this;

    }

    public static void main(String[] args) throws InterruptedException {

        SAVE = new FinalizeGc();

        SAVE = null;

        System.gc();

        Thread.sleep(500);

        if (SAVE != null){

            SAVE.isAlive();

        } else {

            System.out.println("dead");

        }

        SAVE = null;

        System.gc();

        Thread.sleep(500);

        if (SAVE != null){

            SAVE.isAlive();

        } else {

            System.out.println("dead");

        }

    }

}

finalize executed

dead

dead

垃圾收集算法

标记-清除算法

标记-清除算法（mark-sweep），算法分为“标记”和“清除”两个阶段：首先标记出所有需要回收的对象，在标记完成后统一回收掉所有被标记的对象。

缺点：

1、效率问题，标记和清除过程的效率都不高

2、空间碎片问题，标记清除之后会产生大量不连续的内存碎片，空间碎片太多可能会导致：当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发一次GC。

复制算法

复制算法（copying）：将可用内存按容量划分大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将存活着的对象复制到另外一块上面，然后再把已经使用过的空间内存一次清理掉。

优点：不用考虑内存碎片，实现简单，运行高效

缺点：内存变为原来的一半。

标记-整理算法

标记-整理算法（mark-compact）：首先标记出所有需要回收的对象，然后让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存。

分代收集算法

分代收集（Generational Collection）：根据对象的存活周期的不同将java堆内存分为新生代、老年代，根据各个年代的特点选择最适当的收集算法。

在新生代中，每次垃圾收集时都有大批对象死去，只有少量存活，所以选用复制算法，只需要付出少量存活对象的复制成本就可以完成收集。

在老年代中，因为对象存活率高、没有额外的空间对它进行分配担保，就必须使用“标记-清理”或者“标记-整理”算法来进行垃圾回收。

垃圾收集器

收集算法是内存回收的方法论，垃圾收集器是内存回收的具体实现。

并发（Parallel）：指多条垃圾收集线程并行工作，但此时用户线程仍然处于等待状态。

并行（Concurrent）：指用户线程与垃圾收集线程同时执行（但不一定是并行的，可能会交替执行），用户程序继续运行，而垃圾收集程序运行在另一个CPU上。

Serial收集器（新生代）

Serial收集器是一个单线程的收集器，在智慧使用一个CPU或者一条收集线程去完成垃圾收集工作，并且在它进行垃圾收集时，必须暂停其他所有的工作线程（Stop the world），直到它收集结束。

优点：简单而高效（与其他收集器的单线程相比较），对于限定单个COU的环境来说，Serial收集器由于没有线程交互的开销，专心进行垃圾收集，自然可以获得更高的单线程收集效率。

ParNew收集器（新生代）

ParNew收集器就是Serial收集器的多线程版本，是许多运行在Server模式下的虚拟机中首选的新生代收集器。

与Serial收集器的不同点：

使用多条线程进行垃圾收集

与Serial收集器的相同点：

与Serial收集器可用的所有控制参数、收集算法、Stop the world、对象分配规则、回收策略完全一样

目前，除Serial收集器外，只有ParNew收集器能与CMS收集器配合工作。

Parallel Scavenge收集器（新生代）

Pqrallel Scavenge收集器是一个新生代收集器，使用复制算法，也是一个并行的多线程收集器。

目标：达到一个可控制的吞吐量。“吞吐量优先”收集器

吞吐量：CPU用于运行用户代码的时间与CPU总消耗时间的比值，吞吐量=运行用户代码时间 / （运行用户代码时间+垃圾收集时间）。比如虚拟机总共运行了100分钟，其中垃圾收集花掉1分钟，那吞吐量就是99%。

Serial Old收集器（老年代）

Serial Old是Serial收集器的老年代版本，单线程收集器，使用“标记-整理”算法。

Parallel Old收集器（老年代）

Parallel Old是Pqrallel Scavenge的老年代版本，使用多线程和“标记-整理”算法。

CMS收集器（老年代）

CMS（Concurrent Mark Sweep）收集器是一种以获取最短回收停顿时间为目标的收集器，基于“标记-清除”算法实现。

整个过程分为：

1、初始标记（CMS inital mark）

2、并发标记（CMS concurrent mark）

3、重新标记（CMS remark）

4、并发清除（CMS concurrent sweep）

其中，初始标记、重新标记这两步骤仍然需要stop the world。

初始标记只是标记一下GC Roots能直接关联到的对象，速度很快

并发标记阶段就是进行GC Roots Tracing的过程

重新标记阶段则是为了修正并发标记期间，因为用户程序继续运作而导致标记产生变动的那一部分对象的标记记录，这个阶段的停顿时间一般会比初始标记的稍微长一些，但比并发标记的时间短。

由于整个过程中耗时最长的并发标记和并发清除过程中，收集器线程都可以与用户线程一起工作，所以总体上来说，CMS收集器的内存回收过程是与用户线程一起并发的执行。

优点：

并发收集
低停顿

缺点：

CMS收集器对CPU资源非常敏感。在并发阶段，CMS虽然不会导致用户线程停顿，但是会因为占用了一部分线程（CPU资源），而导致应用程序变慢，总吞吐量会降低。CMS默认启动的回收线程数是（CPU数量 + 3） / 4，当CPU在4个以上时，并发回收时垃圾收集线程最多占用不超过25%的CPU资源，但是当CPU数量不足4个时，那么CMS对用户程序的影响就变得很大。
CMS无法处理浮动垃圾，可能出现“Concurrent Mode Failure”失败而导致另一次Full GC的产生。由于CMS并发清理阶段用户线程还在运行着，伴随着程序的运行自然还会产生新的垃圾，这一部分垃圾出现在标记之后，CMS无法在本次收集处理掉它们，只有下一次的GC时再进行清理，这一部分垃圾就是浮动垃圾。
CMS基于“标记-清除”算法，在收集结束时会产生大量的空间碎片。空间碎片过多时，会出现：明明老年代空间剩余很充足，但是无法找到足够大的连续空间来分配对象，不得不提前触发Full GC。CMS提供了-XX:+UseCMSCompactAtFullCollection开关，使其在Full GC后有一个碎片整理的过程，内存整理的过程是无法并发的。虽然碎片的问题解决了。但是停顿时间也变长了。使用-XX:CMSFullGCsBeforeCompaction来设置执行多少次不压缩的Full GC后再执行一次带压缩的Full GC。

G1收集器

最牛逼的垃圾收集器，相比于CMS收集器，有了两个显著的改进：

1、G1收集器是基于“标记-整理”算法实现的收集器，也就是不会产生空间碎片（对于长时间运行的系统来说很棒）。

2、G1收集器可以非常精准的控制停顿，既能让使用者明确指定在一个长度为M毫秒的时间片段内，消耗在垃圾收集上的时间不得超过N毫秒。

G1收集器可以实现在基本不牺牲吞吐量的前提下完成低停顿的内存回收，这是由于它能够以极力的避免进行全区域的垃圾收集。

G1将整个Java堆（新生代、老年代）划分为多个大小固定的独立区域（Region），并且跟踪这些区域里面的垃圾堆积程度，在后台维护一个优先列表，每次根据允许的收集时间，优先回收垃圾最多的区域。

内存分配与回收策略

java的自动内存管理：给对象分配问题、回收分配给对象的内存。

Minor GC：指发生在新生代的垃圾收集动作，因为java对象大多具有朝生夕灭的特性，所以Minor GC非常频繁，回收速度也比较快。

Major GC/Full GC：指发生在老年代的GC，出现了Major GC，经常会伴随至少一次的Minor GC（并非绝对）。Major GC的宿务比Minor GC慢10倍以上。

优先分配在Eden

大多数情况下，对象在新生代Eden区分配，当Eden区没有足够的空间进行分配时，虚拟机将会发起一次Minor GC。

大对象进入老年代

大对象指的是需要连续内存空间的java对象，最典型的就是很长的字符串以及数组。

虚拟机提供了-XX:PretenureSizeThreshold参数，令大于这个设置值的对象直接在老年代中进行分配，避免在Eden以及两个Survivor区之间发生大量的内存拷贝。

长期存活的对象将进入老年代

虚拟机给每个对象定义了一个对象年龄（Age）计数器，如果对象在Eden区出生并经过一次Mior GC后仍然存活，并被survivor容纳，将被移动到survivor区，并将对象年龄设为1。对象在survivor区每熬过一次Minor GC，年龄就会增加1。当它的年龄增加到一定程度（默认15），就会晋升到老年代中，这个阈值可以通过-XX:MaxTenuringThreshold设置。

动态对象年龄判定

如果在survivor空间中相同年龄所有对象大小的总和大于survivor空间的一半，年龄大于或等于该年龄的对象就可以直接进入老年代。

空间分配担保原则

在发生Minor GC时，虚拟机会检测之前每次晋升到老年代的平均大小是否大于老年代的剩余空间大小。如果大于，则直接进行一次Full GC。如果小于，则查看HandlePromotionFailure设置是否允许担保失败，如果允许，那只会进行Minor GC，如果不允许，则也要进行一次Full GC。

新生代使用复制收集算法，但为了内存利用率，只使用其中一个survivor空间来作为轮换备份。当出现大量对象在进行Minor GC后仍然存活的情况（最极端就是内存回收后新生代所有对象都存活），就需要老年代进行分配担保，让survivor无法容纳的对象直接进入老年代。前提是老年代本身还有容纳这些对象的剩余空间，在内存回收之前是无法确定共有多少对象存活下来，所以只有取之前每一次回收晋升到老年代对象容量的平均大小值作为经验值，与老年代剩余空间进行比较，决定是否进行Full GC来让老年代腾出更多空间。（动态概率）