深入理解Java虚拟机:垃圾收集器与内存分配策略(1)

1. 概述

由于程序计数器、虚拟机栈、本地方法栈三个区域是随着线程而生,随线程而灭。这几个部分在编译期间就已经确定内存大小。而Java堆和方法区的内存分配和回收都是动态的,垃圾收集器所关注的是这部分内存

第1章介绍了Java内存运行时区域的各个部分,其中程序计数器、虚拟机栈、本地方法栈三个区域随线程而生,随线程而灭;栈中的栈帧随着方法的进人和退出而有条不素地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的(尽管在运行期会由JT编译器进行一些优化,但在本章基于概念模型的讨论中,大体上可以认为是编译期可知的),因此这几个区域的内存分配和回收都具备确定性,在这几个区域内不需要过多考虑回收的问题,因为方法结束或线程结束时,内存自然就跟随着回收了。而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间时才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾收集器所关注的是这部分内
存,后续讨论中的“内存”分配与回收也仅指这一部分内存。

2. 对象已死?

堆中几乎存放着Java世界中所有的对象实例,GC回收前先确定对象是否存活

2.1 引用计数算法

给对象中添加一个引用计数器,每当一个地方引用它时,计数器值+1,当引用失效时,计数器值-1,任何时刻计数器值为0的对象就是不可能被使用的。

Java语言没有选用引用计数算法来管理内存,其中最主要的原因就是它很难解决对象之间的相互循环引用的问题。

public class ReferenceCountGC {

    public Object instance = null;

    private static final int _1MB = 1024 * 1024;

    private byte[] bigSize = new byte[2 * _1MB];

    public static void main(String[] args) {

        ReferenceCountGC objA = new ReferenceCountGC();
        ReferenceCountGC objB = new ReferenceCountGC();
        objA.instance = objB;
        objB.instance = objA;

        objA = null;
        objB = null;

        System.gc();

    }
}
/*
[0.012s][info][gc] Using G1
[0.077s][info][gc] GC(0) Pause Full (System.gc()) 8M->0M(8M) 6.447ms
*/
# 运行后看输出
java -Xlog:gc*  -Xlog:gc:gcnew.log ReferenceCountGC

从运行结果中可以清楚地看到GC日志中包含“8M->0M”,意味着虚拟机并没有因为这两个对象互相引用就不回收它们,这也从侧面说明虚拟机并不是通过引用计数算法来判断对象是否存活的。

2.2 根搜索算法

在主流的商用程序语言中(Java和c#)都是使用根搜索算法(GC Roots Tracing)判定对象是否存活的。这个算法的基本思路就是通过一些列的名为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots 没有任何引用链相连时,则证明此对象是不可用的。

在Java语言里,可作为 GC Roots的对象包括下面几种:

  1. 虚拟机栈(栈帧中的本地变量表)中的引用的对象
  2. 方法区中的类静态属性引用的对象
  3. 方法区中的常量引用的对象
  4. 本地方法栈中JNI(一般说的Native方法)的引用对象

在这里插入图片描述

2.3 再谈引用

JDK1.2之后,Java对引用的概念进行了扩充,将引用分为:

  1. 强引用(Strong Refrence):类似Object obj = new Object(),只要强引用还存在,GC永远不会回收 被引用的对象
  2. 软引用(Soft Refrence):在系统将要发送内存溢出之前,将会把这些对象列进回收范围之中并进行第二次回收,如果这次回收还是没有足够的内存,才会抛出oom异常。
  3. 弱引用(Weak Refrence):它的强度比软应用更弱一些,被弱引用关联的对象只能生存到下一次GC发生之前,当GC工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
  4. 虚引用(Phantom Refrence):最弱的一种引用,唯一目的就是希望对象被GC回收时收到一个系统通知

2.4 生存还是死亡

在根搜索算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行根搜索后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。

如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会被放置在一个名为F-Queue的队列之中,并在稍后由一条由虚拟机自动建立的、低优先级的Finalizer线程去执行。这里所谓的“执行”是指虚拟机会触发这个方法,但并不承诺会等待它运行结束。这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将很可能会导致F-Queue队列中的其他对象永久处于等待状态,甚至导致整个内存回收系统崩遗。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己,只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(ths关键字)赋值给某个类变量或对象的成员变量,那在第二次标记时它将被移除出“即将回收“的集合;如果对象这时候还没有逃脱,那它就真的离死不远了。

public class FinalizeEscapeGC {
    public static FinalizeEscapeGC SAVE_HOOK = null;

    public void isAlive() {
        System.out.println("yes,i am still alive :)");
    }

    @Override
    protected void finalize() throws Throwable {
        super.finalize();
        System.out.println("finalize mehtod executed!");
        FinalizeEscapeGC.SAVE_HOOK = this;
    }

    public static void main(String[] args) throws InterruptedException {
        SAVE_HOOK = new FinalizeEscapeGC();
        //对象第一次成功拯救自己
        SAVE_HOOK = null;
        System.gc();
        //因为Finalizer方法优先级很低,暂停0.5秒,以等待它
        Thread.sleep(500);
        if (SAVE_HOOK != null) {
            SAVE_HOOK.isAlive();
        } else {
            System.out.println("no i'm dead :( ");
        }
        //下面这段代码与上面的完全相同,但是这次自教却失败了
        SAVE_HOOK = null;
        System.gc();
        //因为Finalizer方法优先级很低,暂停0.5秒,以等待它
        Thread.sleep(500);
        if (SAVE_HOOK != null) {
            SAVE_HOOK.isAlive();
        } else {
            System.out.println("no i'm dead :( ");
        }
    }
}
/*
finalize mehtod executed!
yes,i am still alive :)
no i'm dead :( 
*/

从上面输出可以看到,SAVE HOOK对象的finalize()方法确实被GC收集器触发过,并且在被收集前成功逃脱了。另外一个值得注意的地方就是,代码中有两段完全一样的代码片段,执行结果却是一次逃脱成功,一次失败,这是因为任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码的自救行动失败了。

关于finalize()方法,大家完全 可以忘掉Java语言中有这个方法的存在。这个方法是Java刚诞生时为了使C/C++程序员更容易接受它所做的妥协。运行代价高昂,不确定性大,无法保证各个对象的调用顺序。

2.5 回收方法区

很多人认为方法区(或者HotSpot虚拟机中的永久代)是没有垃圾收集的,Java虚拟机规范确实说过可以不要求虚拟机再方法区实现垃圾收集,而且再方法区进行垃圾收集的“性价比”一般比较低;

在堆中,尤其是新生代中,常规应用进行一次垃圾收集一般可以回收70%~95%的空间,而永久代的垃圾收集效率远低于此。

3. 垃圾收集算法

由于垃圾回收算法的实现涉及大量的程序细节,并且各个平台不一样,这里介绍几种常见的思想及其发展过程

3.1 标记-清除算法

最基础的收集算法是“标记一清除”(Mark-Sweep)算法,如它的名字一样,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。之所以说它是最基础的收集算法,是因为后续的收集算法都是基于这种思路并对其缺点进行改进而得到的。它的主要缺点有两个: 一个是效率问题,标记和清除过程的效率都不高。另外一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致,当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。标记一清除算法的执行过程如下图所示:
在这里插入图片描述

3.2 复制算法

为了解决效率问题,一种称为“复制”(Copying)的收集算法出现了,它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对其中的一块进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为原来的一半,未免太高了一点。复制算法的执行过程如图所示:
在这里插入图片描述
新生代:1个Eden和2个Survivor

3.3 标记-整理算法

复制收集算法在对象存活率较高时就要执行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接选用这种算法。根据老年代的特点,有人提出了另外一种“标记-整理”(Mark-Compact)算法,标记过程仍然与“标记一清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存,“标记一整理”算法的示意图如图所示:
在这里插入图片描述

3.4 分代收集算法

当前商业虚拟机的垃圾收集都采用“分代收集”(Generational Collection)算法,这种算法并没有什么新的思想,只是根据对象的存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记一清理”或“标记一整理”算法来进行回收。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值