垃圾收集器和内存分配策略-1

最新推荐文章于 2024-10-07 11:17:35 发布

chen_vs_dong

最新推荐文章于 2024-10-07 11:17:35 发布

阅读量132

点赞数

分类专栏：深入理解java虚拟机文章标签： jvm oom

深入理解java虚拟机专栏收录该内容

7 篇文章 0 订阅

订阅专栏

为什么要了解GC和内存分配？

当需要排查各种内存溢出，内存泄漏问题时，当垃圾收集成为系统达到更高并发量的瓶颈时，我们就需要对这些自动化技术实施必要的监控和调节。

程序计数器，虚拟机栈，本地方法栈三个区域随线程而生，随线程而灭。栈中的栈帧随着方法的进入和退出而有条不紊的执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上在类结构确定下来时就已知，因此这几个区域的内存分配和回收都具备确定性，在这几个区域就不需要过多考虑回收的问题。因为方法结束或者线程结束时，内存自然就跟着回收了。
而Java堆和方法区则不一样，一个接口中的多个实现类需要的内存可能不一样，一个方法中的多个分支需要的内存也可能不一样，我们只有在程序处于运行期间时才知道会创建哪些对象，这部分内存的分配和回收都是动态的，垃圾回收器所关注的就是这一部分。

引用计数算法
给对象中添加一个引用计数器，每当有一个对象引用它时，计数器值就加1；当引用失效时，计数器值就减1；任何时刻计数器为0的对象就是不可能再被使用的。
但引用计数法是无法解决循环引用的问题的。
请看如下代码

public class ReferenceCountingGC {

    public Object instance = null;

    private static final int _1MB = 1024 * 1024;

    private byte[] bigSize = new byte[2 * _1MB];

    public static void main(String[] args) {
        ReferenceCountingGC objA = new ReferenceCountingGC();
        ReferenceCountingGC objB = new ReferenceCountingGC();
        objA.instance = objB;
        objB.instance = objA;
        objA = null;
        objB = null;
        System.gc();
    }
}

输出结果如下：

[GC (System.gc()) [PSYoungGen: 6764K->528K(38400K)] 6764K->536K(125952K), 0.0019340 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[Full GC (System.gc()) [PSYoungGen: 528K->0K(38400K)] [ParOldGen: 8K->398K(87552K)] 536K->398K(125952K), [Metaspace: 3162K->3162K(1056768K)], 0.0043816 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
Heap
 PSYoungGen      total 38400K, used 998K [0x0000000795580000, 0x0000000798000000, 0x00000007c0000000)
  eden space 33280K, 3% used [0x0000000795580000,0x0000000795679b20,0x0000000797600000)
  from space 5120K, 0% used [0x0000000797600000,0x0000000797600000,0x0000000797b00000)
  to   space 5120K, 0% used [0x0000000797b00000,0x0000000797b00000,0x0000000798000000)
 ParOldGen       total 87552K, used 398K [0x0000000740000000, 0x0000000745580000, 0x0000000795580000)
  object space 87552K, 0% used [0x0000000740000000,0x0000000740063ab8,0x0000000745580000)
 Metaspace       used 3178K, capacity 4496K, committed 4864K, reserved 1056768K
  class space    used 349K, capacity 388K, committed 512K, reserved 1048576K

GC日志中国包含了 6764K -> 528K，可见虚拟机回收了这两个循环依赖的对象，说明java虚拟机并不是通过引用计数法来判断对象是否存活的。

可达性分析算法
可达性分析算法是通过一系列的成为GC Roots的对象作为起始点，从这些节点开始向下搜索，搜索所经过的路径称之为引用链(Reference Chain)，当一个对象到GC roots 没有任何引用链相连(用图论的话来说，就是从GC Roots到这个对象不可达)时，则证明此对象是不可用的。如图中的object567虽然互有关联，但他们是不可用的，所以他们将会被判定为时可回收的对象。

在这里插入图片描述
在Java语言中，可作为GC Roots的对象包括下面几种：

虚拟机栈（栈帧中的本地变量表）中引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象
本地方法栈JNI(即一般说的Native方法)引用的对象

对象引用

在JDK1.2 以前，Java中的引用的定义很传统：如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址，就称这块内存代表着一个引用。
我们希望能描述这样一类对象：当内存空间还足够时，则能保留在内存之中，如果内存空间在进行垃圾回收之后还非常紧张，则可以抛弃这些对象。

强引用/软引用/弱引用/虚引用

强引用就是指在程序中普遍存在的，类似于 Object obj = new Object() 这类的引用，只要强引用还存在，垃圾回收器永远不会回收掉被引用的对象
软引用是用来描述一些还有用但并非必须的对象。对于软引用关联着的对象，在系统将要发生内存溢出异常之前，将会把这些对象列进回收范围之内进行第二次回收。如果这次回收还没有足够的内存，才会抛出内存溢出异常。在JDK1.2之后，提供了SoftReference类来实现软引用。
弱引用也是用来描述非必需对象的，但是他的强度比软引用更弱一些，被虚引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时，无论当前内存是否足够，都会回收掉只被弱引用关联的对象。在JDK1.2之后，提供了WeakReference类来实现弱引用
虚引用也被称为幽灵引用或者幻影引用，他是最弱的一种引用关系。一个对象是否有虚引用的存在，完全不会对其生成时间构成影响，也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。在JDK1.2之后，提供了PhantomReference类来实现虚引用

生存还是死亡
即使在可达性分析算法中不可达的对象，也并非是非死不可的。这时候他们暂时处于缓刑阶段，要真正宣告一个对象死亡，至少要经历两次标记过程：如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链，那它将会被第一次标记并且进行一次筛选，筛选的条件是此对象是否有必要执行finilize() 方法。当对象没有覆盖finalize()方法，或者finalize() 方法已经被虚拟机调用过，虚拟机将这两种情况都视为没必要执行。

如果这个对象被判定有必要执行finalize() 方法，那么这个对象将会放置在一个叫做F-Queue的队列之中。并在稍后由一个虚拟机自动建立的，低优先级的Finalizer线程去执行他。所谓的执行是指虚拟机会触发这个方法，但并不承诺会等待它运行结束，这样做的原因是，如果一个对象在finalize()方法中执行缓慢，或者发生了死循环，将很可能会导致F-Queue队列中其他对象永久处于等待，甚至导致整个内存回收系统奔溃。finalize()方法是对象逃脱死亡命运的最后一次机会。稍后GC将对F-Queue中的对象进行第二次小规模的标记，如果对象要在finalize() 中成功拯救自己-只要重新与引用链上的任何一个对象建立关联即可，比如把自己赋值给某个类变量或者对象的成员变量，那么第二次标记时它将被移除出即将回收的集合；如果对象这时候还没有逃脱，那基本上他就真的被回收了。
我们可以做如下的测试

public class FinalizeEscapeGC {

    public static FinalizeEscapeGC SAVE_HOOK = null;

    public void isSave(){
        System.out.println("yes, i am still alive :");
    }

    @Override
    protected void finalize() throws Throwable {
        super.finalize();
        System.out.println("finalize method executed!");
        FinalizeEscapeGC.SAVE_HOOK = this;
    }

    public static void main(String[] args) throws InterruptedException {
        SAVE_HOOK = new FinalizeEscapeGC();
        // 对象第一次成功拯救自己
        SAVE_HOOK = null;
        System.gc();
        // 因为finalize方法优先级很低，所以暂停0.5S以等待他
        Thread.sleep(500);
        if(SAVE_HOOK != null){
            SAVE_HOOK.isSave();
        }else{
            System.out.println("no, I an died");
        }
        // 与上面的代码完全相同
        SAVE_HOOK = null;
        System.gc();
        // 因为finalize方法优先级很低，所以暂停0.5S以等待他
        Thread.sleep(500);
        if(SAVE_HOOK != null){
            SAVE_HOOK.isSave();
        }else{
            System.out.println("no, I an died");
        }

    }
}

输出

finalize method executed!
yes, i am still alive :
no, I an died

SAVE_HOOK对象的finalize() 方法确实被GC收集器触发过，并且在被收集前成功逃脱了
而第一次成功逃脱，第二次失败，是因为任何一个对象的finalize() 方法都只会被系统自动调用一次，如果对象面临下一个回收，他的finalize方法就不会被执行，因此第二段代码自救失败了。

回收方法区
Java虚拟机规范不要求虚拟机在方法区实现垃圾回收，而且在方法区中进行垃圾回收的性价比一般比较低，在堆中，尤其是在新生代中，常规应用进行一次垃圾收集一般可以回收70-95%的空间，而永久代的垃圾收集效率远低于此。
永久代的垃圾收集主要回收两部分内容：废弃常量和无用的类。回收废弃常量与回收Java堆中的对象非常类似。以常量池中字面量的回收为例，假如一个字符串abc已经进入了常量池中，但是当前系统没有任何一个String对象是叫做abc的，换句话说，就是没有任何String对象引用常量池中的abc常量，也没有其他地方引用了这个字面量，如果这个时候发生内存回收，而且必要的话，这个abc常量就会被系统清理出常量池。常量池中的其他类(接口)，方法，字段的符号引用也与此类似。

判断一个常量是否是废弃常量比较简单，而要判定一个类是否是无用的类的条件则相对苛刻很多。类需要同时满足下面三个条件才能算是无用的类：

该类所有的实例都已经被回收，也就是Java堆中不存在该类的任何实例
加载该类的ClassLoader已经被回收
该类对应的java.lang.Class 对象没有在任何地方被引用，无法在任何地方通过反射访问该类的方法

虚拟机可以对满足上述3个条件的无用类进行回收，这里说的仅仅是可以，而并不是和对象一样，不使用了就必须被回收。是否对类进行回收，HotSpot虚拟机提供了 -Xnoclassgc参数进行控制，还可以使用-vebose:class 以及-XX：+TraceClassLoading，-XX:+TraceClassUnLoading查看类加载和卸载信息，其中 -verbose：class 和 -XX:TraceClassLoading可以在Product版的虚拟机中使用，-XX:TraceClassUnLoading参数需要FastDebug版的虚拟机支持
在大量使用反射，动态代理，CGLib和ByteCode框架，动态生成JSP以及OSGI这类频繁自定义ClassLoader的场景都需要虚拟机具备类卸载的功能，以确保永久带不会溢出。