【深入理解JVM】垃圾收集器和内存分配策略(3)

第3章 垃圾收集器和内存分配策略

3.1 概述

     Java程序通过reference类型数据操作堆上的具体对象.在JVM层面的引用reference类型是引用类型(Reference Types)的一种;JVM规范规定reference类型来表示对某个对象的引用,可以想象成类似于一个指向对象的指针;对象的操作、传递和检查都通过引用它的reference类型的数据进行操作。在Java语言层面的引用如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。

3.2 对象已死吗?

    判断对象的存活与否的方法。

  1. 引用计数算法

     引用计数算法是在对象中添加一个引用计数器,每当有一个地方引用它,计数器就加1;当引用失效,计算器值就减1;任何时刻计数器的值为0时该对象就是不可用的。

    该方法实现简单,判定效率也很高。但是,java虚拟机中没有使用该方法,其中最主要的原因是该方法不能解决对象之间相互循环引用的问题。

    2.可达性分析算法  

    该算法基本思想是:通过一系列被称为“GC Roots”的对象作为起始点,从该起始点开始向下搜索,搜索所走过的路径叫做引用链,当一个对象到GC Roots没有任何引用链时,则证明该对象是不可用的


    在Java中,可作为GC Roots对象包括:虚拟机栈(栈帧的本地变量表)中引用的对象、方法区中类静态属性引用的对象、方法区中常量引用的对象、本地方法栈中JNI(一般说的Native方法)引用的对象。

    3. 再谈引用

    JDK 1.2将Java的引用分为:强引用、软引用、弱引用、虚引用4种,强度一次减弱。

  • 强引用:就是常见的引用,类似 Object o=new Object() 这类引用,只要强引用存在,垃圾收集器永远不会回收被引用的对象。
  • 软引用: 描述一些还有用但非必需的对象。软引用关联的对象,在系统将要发生内存溢出之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收没有足够的内存,才会发生内存溢出异常。提供SoftReference类实现软引用。
  • 弱引用: 也用来描述非必需的对象,比软引用还要弱。该引用引用的对象只能生存到下一次垃圾收集器发生之前。当垃圾回收器工作时,不论内存是否足够都会回收被弱引用引用的对象。提供WeakReference类实现弱引用。
  • 虚引用:又称幽灵引用或者幻影引用,最弱的引用关系。一个对象是否有该引用存在,完全不会对其生存时间构成影响,也无法通过该引用获得一个对象实例。唯一目的是:能在这个对象再被收集器回收时收到一个系统通知。提供PhantomReference类实现虚引用。

    4.对象生存还是死亡

    要真正宣告一个对象死亡,至少要经历两次标记过程:

    第一次标记:如果对象在进行可达性分析后发现到GC Roots没有任何引用链相连时,那么它将被第一次标记并且进行一次筛选,筛选的条件是此对象是否必要执行finalize()方法。对象没有覆盖finalize()方法或者finalize()方法已经被JVM调用过,虚拟机认为这两种情况都是没必要执行,可以认为对象已死可以回收。如果对象被判定有必要执行finalize()方法那么这个对象将会被放入F-Queue队列中,并在稍后由一个由JVM自动建立的、低优先级的Finalizer线程执行它。

    第二次标记:finalize()方法是对象逃脱死亡的最后一次机会,GC将对F-Queue队列中的对象进行第二次小规模标记。如果对象在其finalize()方法中重新与引用链上任何一个对象建立关联,第二次标记时会将其移出"即将回收"的集合;如果对象没有逃脱,也可以认为对象已死,可以回收了。

     一个对象的finalize()方法只会被系统自动调用一次,经过finalize()方法逃脱死亡的对象,第二次不会再调用。

    5.回收方法区

    方法区(HotSpot叫永久代)的垃圾回收主要回收:废弃常量和无用的类。

    判定废弃常量比较简单,但是判定无用类比较苛刻。类要同时满足下面3个条件才能算无用的类:

  • 该类的所有实例都被回收,就是java堆中不存在该类的任何实例
  • 加载该类的ClassLoader已经别回收
  • 该类的java.lang.Class对象没有被任何地方引用,无法在任何地方通过反射访问该类的方法

3.3. 垃圾收集算法

    1、标记-清除算法

    最基础的收集算法是“标记-清除”(Mark-Sweep)算法,该算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象,标记过程在前面讲述对象标记判定时已经基本介绍过了。说它是最基础的收集算法,是因为后续的收集算法都是基于这种思路并对其缺点进行改进而得到的。它的主要缺点有两个:一个是效率问题,标记和清除过程的效率都不高;另外一个是空间问题,标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致,当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。 

 

    2、复制算法

    为了解决效率问题,一种称为“复制”(Copying)的收集算法出现了,它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这样使得每次都是对其中的一块进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为原来的一半,未免太高了一点。

 

    现在的商业虚拟机都采用这种收集算法来回收新生代,新生代中的对象98%是朝生夕死的,所以并不需要按照1∶1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中的一块Survivor。当回收时,将Eden和Survivor中还存活着的对象一次性地拷贝到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor的空间。HotSpot虚拟机默认Eden和Survivor的大小比例是8∶1,也就是每次新生代中可用内存空间为整个新生代容量的90%(80%+10%),只有10%的内存是会被“浪费”的。当然,98%的对象可回收只是一般场景下的数据,我们没有办法保证每次回收都只有不多于10%的对象存活,当Survivor空间不够用时,需要依赖其他内存(这里指老年代)进行分配担保(Handle Promotion)。

    3、标记-整理算法

    复制收集算法在对象存活率较高时就要执行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接选用这种算法。根据老年代的特点,有人提出了另外一种“标记-整理”(Mark-Compact)算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

 

    4、分代收集算法

    当前商业虚拟机的垃圾收集都采用“分代收集”(Generational Collection)算法,一般是把Java堆分为新生代和老年代。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记-清理”或“标记-整理”算法来进行回收。 

3.4 HotSpot的算法实现

    1.枚举根节点

    从可达性分析中从GC Roots节点找引用链这个操作为例,可作为GC Roots的节点主要在全局性的引用(例如常量或类静态属性)与执行上下文(例如栈帧中的本地变量表)中 ,现在很多应用仅仅方法区就有数百兆,如果要逐个检查这里面的引用,那么必然会消耗很多时间。

    另外 ,可达性分析对执行时间的敏感还体现在GC停顿上 ,因为这项分析工作必须在一个能确保一致性的快照中进行——这里“一致性”的意思是指在整个分析期间整个执行系统看起来就像被冻结在某个时间点上,不可以出现分析过程中对象引用关系还在不断变化的情况 ,该点不满足的话分析结果准确性就无法得到保证。这点是导致GC进行时必须停顿所有Java执行线程(Sun将这件事情称为“Stop The World”)的其中一个重要原因,即使是在号称(几乎)不会发生停顿的CMS收集器中,枚举根节点时也是必须要停顿的.

    由于目前的主流Java虛拟机使用的都是准确式GC ,所以当执行系统停顿下来后,并不需要一个不漏地检查完所有执行上下文和全局的引用位置,虚拟机应当是有办法直接得知哪些地方存放着对象引用。在HotSpot的实现中,是使用一组称为OopMap的数据结构来达到这个目的的,在类加载完成的时候 ,HotSpot就把对象内什么偏移量上是什么类型的数据计算出来,在JIT编译过程中,也会在特定的位置记录下栈和寄存器中哪些位置是引用。这样 ,GC在扫描时就可以直接得知这些信息了。

    2.安全点

    在OopMap的协助下,HotSpot可以快速且准确地完成GC Roots枚举 ,但一个很现实的问题随之而来:可能导致引用关系变化,或者说OopMap内容变化的指令非常多,如果为每一条指令都生成对应的OopMap,那将会需要大量的额外空间,这样GC的空间成本将会变得很高。

    实际上,HotSpot也的确没有为每条指令都生成OopMap ,前面已经提到 ,只是在“特定的位置”记录了这些信息,这些位置称为安全点(Safepoint) ,即程序执行时并非在所有地方都能停顿下来开始GC ,只有在到达安全点时才能暂停。Safepoint的选定既不能太少以致于让GC等待时间太长,也不能过于频繁以致于过分增大运行时的负荷。所以 ,安全点的选定基本上是以程序“是否具有让程序长时间执行的特征”为标准进行选定的——因为每条指令执行的时间都非常短暂,程序不太可能因为指令流长度太长这个原因而过长时间运行,“长时间执行”的最明显特征就是指令序列复用,例如方法调用、循环跳转、异常跳转等,所以具有这些功能的指令才会产生Safepoint。

    对于Sefepomt,另一个需要考虑的问题是如何在GC发生时让所有线程(这里不包括执行JNI调用的线程)都“跑”到最近的安全点上再停顿下来。这里有两种方案可供选择:抢先式中断( Preemptive Suspension ) 和主动式中断( Wuntary Suspension ) ,其中抢先式中断不需要线程的执行代码主动去配合,在GC发生时 ,首先把所有线程全部中断,如果发现有线程中断的地方不在安全点上,就恢复线程,让它“跑”到安全点上。现在几乎没有虚拟机实现采用抢先式中断来暂停线程从而响应GC事件。

    而主动式中断的思想是当GC需要中断线程的时候,不直接对线程操作,仅仅简单地设置一个标志,各个线程执行时主动去轮询这个标志,发现中断标志为真时就自己中断挂起。 轮询标志的地方和安全点是重合的,另外再加上创建对象需要分配内存的地方。

    3、安全区域

    使用Safepoint似乎已经完美地解决了如何进入GC的问题 ,但实际情况却并不一定。 Safepoint机制保证了程序执行时,在不太长的时间内就会遇到可进入GC的Safepoint。但是 , 程序“不执行”的时候呢?所谓的程序不执行就是没有分配CPU时间 ,典型的例子就是线程处于Sleep状态或者Blocked状态 ,这时候线程无法响应JVM的中断请求,“走”到安全的地方去中断挂起,JVM也显然不太可能等待线程重新被分配CPU时间。对于这种情况,就需要安全区域( SafeRegion)来解决。

    安全区域是指在一段代码片段之中,引用关系不会发生变化。在这个区域中的任意地方开始GC都是安全的。我们也可以把Safe Region看做是被扩展了的Safepoint。

    在线程执行到Safe Region中的代码时,首先标识自己已经进入了Safe Region,那样,当在这段时间里JVM要发起GC时,就不用管标识自己为Safe Region状态的线程了。在线程要离 开Safe Region时 ,它要检查系统是否已经完成了根节点枚举(或者是整个GC过程),如果完成了 ,那线程就继续执行,否则它就必须等待直到收到可以安全离开Safe Region的信号为 止。

3.5 垃圾收集器

    如果两个收集器之间存在连线,就说明它们可以搭配使用。

   1、Serial收集器

    Serial收集器是最基本、历史最悠久的收集器,是一个单线程的收集器,但它的“单线程”的意义并不仅仅是说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程(Sun将这件事情称之为“Stop The World”),直到它收集结束。这项工作实际上是由虚拟机在后台自动发起和自动完成的,在用户不可见的情况下把用户的正常工作的线程全部停掉,这对很多应用来说都是难以接受的


   Serial收集器是虚拟机运行在Client模式下的默认新生代收集器。它也有着优于其他收集器的地方:简单而高效(与其他收集器的单线程比),对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。

    2、ParNew收集器

    ParNew收集器其实就是Serial收集器的多线程版本,除了使用多条线程进行垃圾收集之外,其余行为包括Serial收集器可用的所有控制参数(例如:-XX:SurvivorRatio、 -XX:PretenureSizeThreshold、-XX:HandlePromotionFailure等)、收集算法、Stop The World、对象分配规则、回收策略等都与Serial收集器完全一样,实现上这两种收集器也共用了相当多的代码。


    ParNew收集器是许多运行在Server模式下的虚拟机中首选的新生代收集器,其中有一个与性能无关但很重要的原因是,除了Serial收集器外,目前只有它能与CMS收集器配合工作。

    3、ParallelScavenge收集器

    Parallel Scavenge收集器也是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集器……看上去和ParNew都一样,那它有什么特别之处呢?Parallel Scavenge收集器的特点是它的关注点与其他收集器不同,CMS等收集器的关注点尽可能地缩短垃圾收集时用户线程的停顿时间,而ParallelScavenge收集器的目标则是达到一个可控制的吞吐量(Throughput)。所谓吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值,即吞吐量 = 运行用户代码时间 /(运行用户代码时间 + 垃圾收集时间),虚拟机总共运行了100分钟,其中垃圾收集花掉1分钟,那吞吐量就是99%。停顿时间越短就越适合需要与用户交互的程序,良好的响应速度能提升用户的体验;而高吞吐量则可以最高效率地利用CPU时间,尽快地完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。Parallel Scavenge收集器提供了两个参数用于精确控制吞吐量,分别是控制最大垃圾收集停顿时间的-XX:MaxGCPauseMillis参数及直接设置吞吐量大小的-XX:GCTimeRatio参数。

    4、Serial Old收集器

    Serial Old是Serial收集器的老年代版本,它同样是一个单线程收集器,使用“标记-整理”算法。这个收集器的主要意义也是被Client模式下的虚拟机使用。如果在Server模式下,它主要还有两大用途:一个是在JDK 1.5及之前的版本中与Parallel Scavenge收集器搭配使用,另外一个就是作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure的时候使用。这两点都将在后面的内容中详细讲解。

 

    5、Parallel Old收集器

    Parallel Old是ParallelScavenge收集器的老年代版本,使用多线程和“标记-整理”算法。直到Parallel Old收集器出现后,“吞吐量优先”收集器终于有了比较名副其实的应用组合,在注重吞吐量及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge加Parallel Old收集器。Parallel Old收集器的工作过程如图3-9所示。

 

    6、CMS收集器

    CMS(Concurrent MarkSweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用都集中在互联网站或B/S系统的服务端上。从名字(包含“Mark Sweep”)上就可以看出CMS收集器是基于“标记-清除”算法实现的,它的运作过程相对于前面几种收集器来说要更复杂一些,整个过程分为4个步骤,包括:初始标记(CMS initial mark)、并发标记(CMS concurrent mark)、重新标记(CMS remark)、并发清除(CMS concurrent sweep)

    其中初始标记、重新标记这两个步骤仍然需要“Stop The World”。初始标记仅仅只是标记一下GC Roots能直接关联到的对象,速度很快,并发标记阶段就是进行GC RootsTracing的过程,而重新标记阶段则是为了修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短。由于整个过程中耗时最长的并发标记和并发清除过程中,收集器线程都可以与用户线程一起工作,所以总体上来说,CMS收集器的内存回收过程是与用户线程一起并发地执行的。通过图3-10可以比较清楚地看到CMS收集器的运作步骤中并发和需要停顿的时间。

    CMS有以下三个显著的缺点:

    CMS收集器对CPU资源非常敏感。CMS收集器无法处理浮动垃圾(FloatingGarbage),可能出现“Concurrent Mode Failure”失败而导致另一次Full GC的产生。CMS是一款基于“标记-清除”算法实现的收集器,这意味着收集结束时会产生大量空间碎片。

    7 、G1收集器

    G1是一款面向服务端应用的垃圾收集器。与其他GC收集器相比,G1具备如下特点: 并行与并发、分代收集、空间整合、可预测的停顿

    在G1之前的其他收集器进行收集的范围都是整个新生代或者老年代,而使用G1收集器时,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。G1收集器之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得空间大小以及回收所需时间的经验值),在后台维护一个优先级列表,每次根据允许的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的由来)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限的时间内可以获取尽可能高的收集效率。

    G1所面临的问题:Region不可能是孤立的。一个对象分配在某个Region中,它并非只能被本Region中的其他对象引用,而是可以与整个Java堆任意的对象发生引用关系。那么在做可达性分析确定对象是否存活的时候,岂不是还得扫描整个Java堆才能保证准确性?这个问题其实并非G1中才有,只是在G1中更加突出而已。在以前的分代收集中,新生代的规模一般都比老年代要小许多,新生代的收集也比老年代要频繁许多,那回收新生代中的对象时也面临相同的问题,如果回收新生代时也不得不同时扫描老年代的话,那么Minor GC的效率可能下降不少。

    在G1收集器中,Region之间的对象引用以及其他收集器中的新生代与老年代之间的对象引用,虚拟机都是使用Remembered Set来避免全堆扫描的。G1中每个Region都有一个与之对应的Remembered Set,虚拟机发现程序在对Reference类型的数据进行写操作时,会产生一个Write Barrier暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中(在分代的例子中就是检查是否老年代中的对象引用了新生代中的对象),如果是,便通过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set之中。当进行内存回收时,在GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。

    如果不计算维护Remembered Set的操作,G1收集器的运作大致可划分为以下几个步骤:

  •  初始标记(Initial Marking):并行,仅仅只是标记一下GC Roots能直接关联到的对象,并且修改TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可用的Region中创建新对象,这阶段需要停顿线程,但耗时很短;
  • 并发标记(Concurrent Marking):并发,从GC Root开始对堆中对象进行可达性分析,找出存活的对象,这阶段耗时较长;
  • 最终标记(Final Marking):并行,为了修正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录,虚拟机将这段时间对象变化记录在线程Remembered Set Logs里面,需要把Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿线程,停顿时间一般会比初始标记阶段稍长一些,但远比并发标记的时间短;
  • 筛选回收(Live Data Counting and Evacuation):并行,首先对各个Region的回收价值和成本进行排序,然后根据用户所期望的GC停顿时间来制定回收计划。这个阶段其实也可以做到与用户程序一起并发执行,但是因为只回收一部分Region,时间是用户可控制的,而且停顿用户线程将大幅提供收集效率;

    8 垃圾收集器参数总结

                                                    

3.6 内存分配与回收策略

    Java技术体系中所提倡的自动内存管理最终可以归结为自动化地解决了两个问题:给对象分配内存以及回收分配给对象的内存。对象的内存分配,往大方向上讲,就是在堆上分配(但也可能经过JIT编译后被拆散为标量类型并间接地在栈上分配),对象主要分配在新生代的Eden区上,如果启动了本地线程分配缓冲,将按线程优先在TLAB上分配。少数情况下也可能会直接分配在老年代中,分配的规则并不是百分之百固定的,其细节取决于当前使用的是哪一种垃圾收集器组合,还有虚拟机中与内存相关的参数的设置。接下来我们将会讲解几条最普遍的内存分配规则,并通过代码去验证这些规则。本节中的代码在测试时使用Client模式虚拟机运行,没有手工指定收集器组合,换句话说,验证的是使用Serial/ Serial Old收集器下(ParNew / Serial Old收集器组合的规则也基本一致)的内存分配和回收的策略。

   1 对象优先在Eden分配

    大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够的空间进行分配时,虚拟机将发起一次Minor GC。

    新生代GC(Minor GC):指发生在新生代的垃圾收集动作,因为Java对象大多都具备朝生夕灭的特性,所以Minor GC非常频繁,一般回收速度也比较快。

    老年代GC(Major GC /Full GC):指发生在老年代的GC,出现了Major GC,经常会伴随至少一次的Minor GC(但非绝对的,在ParallelScavenge收集器的收集策略里就有直接进行Major GC的策略选择过程)。MajorGC的速度一般会比Minor GC慢10倍以上。

    2、大对象直接进入老年代

     大对象就是指,需要大量连续内存空间的Java对象,最典型的大对象就是那种很长的字符串及数组

    3、长期存活的对象将进入老年代

    4 动态对象年龄判定

    为了能更好地适应不同程序的内存状况,虚拟机并不总是要求对象的年龄必须达到MaxTenuringThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到MaxTenuringThreshold中要求的年龄。

    5 空间分配担保

    在发生Minor GC时,虚拟机会检测之前每次晋升到老年代的平均大小是否大于老年代的剩余空间大小,如果大于,则改为直接进行一次Full GC。如果小于,则查看HandlePromotionFailure设置是否允许担保失败;如果允许,那只会进行Minor GC;如果不允许,则也要改为进行一次Full GC。

    前面提到过,新生代使用复制收集算法,但为了内存利用率,只使用其中一个Survivor空间来作为轮换备份,因此当出现大量对象在Minor GC后仍然存活的情况时(最极端就是内存回收后新生代中所有对象都存活),就需要老年代进行分配担保,让Survivor无法容纳的对象直接进入老年代。与生活中的贷款担保类似,老年代要进行这样的担保,前提是老年代本身还有容纳这些对象的剩余空间,一共有多少对象会活下来,在实际完成内存回收之前是无法明确知道的,所以只好取之前每一次回收晋升到老年代对象容量的平均大小值作为经验值,与老年代的剩余空间进行比较,决定是否进行Full GC来让老年代腾出更多空间。

第4章 虚拟机性能监控与故障处理工具

第5章 调优案例分析与实战


阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

【深入理解JVM】垃圾收集器和内存分配策略(3)

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭