第三章 垃圾收集器与内存分配策略

3.1 概述

      1960年诞生的Lisp是第一门真正使用内存动态分配和垃圾收集技术的语言。程序计数器、虚拟机栈、本地方法栈三个区域随线程而生,随线程而灭;栈中的栈帧随着方法的进入和退出而有条不紊的执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来时就已知的,因此这几个区域的内存分配和回收都具备确定性,在这几个区域内不需要过多考虑回收的问题,因为方法结束或线程结束时,内存自然就跟着回收了。而Java堆和方法区则不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存也可能不一样,我们只有在程序处于运行期间时才能知道会创建哪些对象,这部分内存的分配和回收都是动态的,垃圾回收期关注的是这部分内存。

3.2 对象已死

3.2.1 引用计数算法

      给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,;当引用失效时,计数器值就减1;任何时刻计数器值为0的对象就是不可能再被使用的。

      Java语言中没有选用计数算法来管理内存,其中最主要的原因是它很难解决对象之间的相互循环引用的问题。比如:对象objA和objB都有字段instance,赋值令objA.instance = objB及objB.instance = objA,除此之外,这两个对象再无任何引用,实际上这两个对象已经不可能再被访问,但是它们因为互相引用着对方,导致它们的引用计数都不为0,于是引用计数算法无法通知GC收集器回收它们。

3.2.2 根搜索算法

      在主流的商用程序语言中,都是使用根搜索算法判定对象是否存活的。这个算法的思路就是通过一系列的名为“GC Roots ”的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径成为“引用链”,当一个对象到GC Roots没有任何的链相连,则证明此对象是不可用的。

      在Java语言里,可作为GC Roots的对象包括下面几种:(虚拟机栈中的引用的对象、方法区中的类静态属性引用的对象、方法区中的常量引用的对象、本地方法栈中JNI的引用的对象)。

3.2.3 再谈引用

      无论是通过引用计数算法判断对象的引用数量还是通过根搜索算法判断对象的引用链是否可达,判定对象是否存活都与“引用”有关。如果reference类型的数据中存储的数值代表的是另一块内存的起始地址,就成这块内存代表着一个引用。

      在JDK1.2之后,Java对引用的概念进行了扩充,将引用分为强引用、软引用、弱引用、虚引用四种,这四种引用强度依次逐渐减弱。

      强引用就是指程序代码之中普遍存在的,类似“Object obj = new Object()”这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。 软引用用来描述一些还有用,但并非必须的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中并进行第二次回收。如果这次回收还是没有足够的内存,才会抛出内存溢出异常。在JDK1.2之后,提供了SoftReference类来实现软引用。 弱引用也是用来描述非必须对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。WeakReference  虚引用也被称为幽灵引用或者幻影引用,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是希望能在这个对象被收集器回收时收到一个系统通知。PhantomReference。

3.2.4 回收方法区

      在方法区中进行垃圾收集的性价比一般比较低,在堆中,尤其在新生代中,常规应用进行一次垃圾收集一般可以回收70-90%的空间,而永久代的垃圾收集效率远低于此。永久代的垃圾收集主要回收两部分内容:废弃常量和无用的类。

      判断一个常量是否是废弃常量比较简单,而要判定一个类是否是无用的类的条件则相对苛刻许多。类需要同时满足下面3个条件才能算是无用的类。(该类所有的实例都已经被回收,也就是Java堆中不存在该类的任何实例;加载该类的ClassLoader已经被回收;该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。) 

      虚拟机可以对满足上述3个条件的无用类进行回收,这里说的仅仅是“可以”,而不是和对象一样,不使用了就必然会回收。在大量使用反射、动态代理、CGLib等bytecode框架的场景,以及动态生成JSP和OSGi这类频繁自定义ClassLoader的场景都需要虚拟机具备类卸载的功能,以保证永久代不会溢出。

3.3 垃圾收集算法

3.3.1 标记——清除算法

       最基础的收集算法是标记-清除算法,如它的名字一样,算法分为标记和清除两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。它的主要缺点有两个:一个是效率问题,标记和清除的过程效率都不高;另外一个是空间问题,标记清楚之后会产生大量不连续的内存碎片,空间碎片过多可能会导致当程序在以后的运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

3.3.2 复制算法

       它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。这种算法的代价是将内存缩小为原来的一半,未免太高了一点。

3.3.3 标记——整理算法

      标记过程仍然与“标记——清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有可存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

3.3.4 分代收集算法

      当前商业虚拟机的垃圾收集都采用“分代收集”算法,这种算法并没有什么新的思想,只是根据对象的存活周期的不同将内存划分为几块。一般是把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用“标记——清理”或“标记——整理”算法来进行回收。

3.4 垃圾收集器

      如果说垃圾收集算法是内存回收的方法论,垃圾回收器就是内存回收的具体实现。java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同厂商不同版本的虚拟机所提供的垃圾收集器都可能有很大的差别。

3.4.1 Serial收集器

      最基本,历史最悠久的收集器,在JDK1.3.1之前是虚拟机新生代收集的唯一选择。这个收集器是一个单线程的收集器,“单线程”的意义不仅仅是说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。优于其他收集器的地方:简单而高效,对于限定单个CPU环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。

3.4.2 ParNew收集器

      是Serial收集器的多线程版本,除了使用多线程进行垃圾收集之外,其余行为包括Serial收集器可用的所有控制参数、收集算法、Stop The World、对象分配规则、回收策略等都与Serial收集器完全一样,实现这两种收集器也共用了相当多的代码。

3.4.3 Parallel Scavenge收集器

      Parallel Scavenge收集器也是一个新生代收集器,它也是使用复制算法的收集器 ,又是并行的多线程收集器。它的特点是它的关注点与其他收集器不同,CMS等收集器的关注点是尽可能的缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目标是达到一个可控制的吞吐量。

3.4.4 Serial Old收集器

      是Serial收集器的老年代版本,它同样是一个单线程收集器,使用“标记——整理”算法。这个收集器的主要意义也是被Client模式下的虚拟机使用。

3.4.5 Parallel Old收集器

      是Parallel收集器的老年代版本,这个收集器是在JDK1.6中才开始提供的,在此之前,新生代的Parallel Scavenge收集器一直处于比较尴尬的状态。原因是,如果新生代选择了Parallel Scavenge收集器,老年代除了Serial Old收集器别无选择。

3.4.6 CMS收集器

      CMS收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的java应用都集中在互联网站或B/S系统的服务端上,这类应用尤其重视服务的响应速度,希望系统停顿时间最短,已给用户带来较好的体验。基于“标记——清除算法”,它的运作过程相对于前面几种收集器来说要更复杂一些,整个过程分为4个步骤:初始标记、并发标记、重新标记、并发清除。

      优点:并发收集,低停顿。 

      缺点:CMS收集器对CPU资源非常敏感;CMS收集器无法处理浮动垃圾,可能出现“Concurrent Mode Failure”失败而导致另一次Full GC的产生。由于CMS并发清理阶段用户线程还在运行着,伴随程序的运行自然还会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在本次收集中处理掉它们,只好留待下一次GC时再将其处理掉。这一部分垃圾就称为浮动垃圾;最后一个缺点是收集结束时会产生大量的空间碎片,空间碎片过多时将会给大对象分配带来很大的麻烦,往往会出现老年代还有很大的空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前触发一次Full GC。

3.4.7 G1收集器

      G1收集器是垃圾收集器理论进一步发展的产物,它与前面的CMS收集器相比有两个显著的改进:一是G1收集器是基于“标记——整理”算法实现的收集器,也就是说它不会产生空间碎片,这对于长时间运行的应用系统来说十分重要。二是它可以非常精确的控制停顿,既能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒,这几乎己经是实时Java的垃圾收集器的特征了。G1收集器可以实现在基本上不牺牲吞吐量的前提下完成低停顿的内存回收。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值