【Java小知识】垃圾回收GC你不得不知道的事情

前言

前面我们讲了关于JVM内存模型中,Java堆是内存中最大的一块区域,几乎存放着所有的对象实例。 可参考:JVM内存模型 关于垃圾回收时我们在思考什么:
哪些内存需要回收?
什么时候回收?
如何回收?

判定对象是否存活

在进行垃圾回收之前,当然第一件事就是确定这些对象之中哪些还“存活”着,哪些已经“死去”,死去意味着不可能再被使用的对象。那么Java是通过什么来判断对象是否存活呢?

引用计数算法:

引用计数法顾名思义就是:给对象添加一个引用计数器,每当有一个地方引用它时,计数器就+1;当引用失效时,计数器就-1;任何时刻计数器为0的对象就是不可能再被使用的。

实现简单,判定效率高,在大部分情况下它是一个不错的算法,但是无法解决对象之间相互循环引用的问题。
所以Java虚拟机并不是使用的引用计数算法。

可达性分析算法:

Java虚拟机是通过可达性分析(Reachability Analysis)来判断对象是否存活的。

通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始由下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连时(用图论的话来说,就是GC Roots到这个对象不可达),则证明此对象是不可用的。

如下图所示:对象object5,object6,object7虽然互相有关联,但是它们的GC Roots是不可达的,所以它们将会被判定为是可回收的对象。

可达性分析算法判定对象是否可回收

可作为GC Roots的对象包括下面几种:

  1. 虚拟机栈中引用的对象;
  2. 方法区中类静态属性引用的对象;
  3. 方法区中常量引用的对象;
  4. 本地方法栈中native引用的对象。

注意:

即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,它们暂时处于“缓刑”的阶段,要真正宣告一个对象死亡,至少需要经历两次标记过程:

如果对象在进行可达性分析后发现不可达,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。(当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”)。

如果对象被判定为有必要执行finalize()方法,那么这个对象将会被放置在一个叫做F-Queue的队列之中,由虚拟机去执行触发这个方法。

finalize()方法是对象逃脱死亡命令的最后一次机会,稍后GC将会对F-Queue中的对象进行第二次标记,如果对象要在finalize()中成功拯救自己–只要重新与引用链上的任何一个对象建立关联即可,比如把自己(this 关键字)赋值给某个类变量或者对象的成员变量,那么在第二次标记时它将被移除出“即将回收”的集合。

引用

判定对象是否存活都与引用相关。引用分为强引用、软引用、弱引用、虚引用4种,这4种引用强度依次逐渐减弱。

  • 强引用:在程序中普遍存在的,如Object obj= new Object(),只要强引用还存在,GC回收器永远不会回收掉被引用的对象。
  • 软引用:描述一些还有用但并非必需的对象,对于软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。提供了SoftReference类来实现软引用。
  • 弱引用:描述非必需对象,强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次GC发生之前。当GC时,无论当前内存是否足够,都回回收掉只被弱引用关联的对象。提供了WeakReference类来实现软引用。
  • 虚引用:最弱的一种引用关系。一个对象是否有虚拟引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的就是能在这个对象被GC回收时收到一个系统通知。提供了PhantomReference类来实现软引用。

回收方法区

方法区也会进行垃圾回收,回收的主要内容是:废弃常量和无用的类。

垃圾收集算法

垃圾收集算法主要有:标记-清除算法、复制算法、标记-整理算法、分代收集算法。

标记-清除算法

顾名思义,算法分为两个阶段:标记和清除,是最基础的收集算法。
首先标记出需要回收的对象,在标记完成后统一回收所有被标记的对象。
不足在于:效率不高、同时会产生大量不连续的内存碎片。如下图所示:
在这里插入图片描述

复制算法

为了解决效率问题,复制算法出现了,它可以将内存按容量划分成大小相等的两块,每次只使用其中的一块。
当这一块内存用完了,就将还存活的对象复制到另一块上面,然后再把已经使用过的内存空间一次清理掉。
这样每次都是对整个半区进行内存回收,内存分配时也不用考虑内存碎片等复杂情况,只需要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。
不足在于:代价是将内存缩小了一半。
在这里插入图片描述
优化:

IBM公司专门研究表明:新生代中的对象98%都是朝生夕死的,所以并不需要要按1:1的比例来划分内存空间,而是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。

当回收时,将Eden和Survivor中还存活着的对象一次性复制到另一块Survivor空间上,最后清理Eden和刚才使用过的Survivor空间。

默认下比例是8:1。

复制算法在对象存活率较高时要进行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以老年代一般不能直接选用这种算法。

标记-整理算法

根据老年代的特点,提出了标记-整理算法,过程与标记-清除算法一样,但不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
在这里插入图片描述

分代收集算法

将Java堆划分为新生代和老年代,根据各个年代的特点采用最适当的收集算法。

在新生代中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用复制算法,只需要付出少量存活对象的复制成本就可以完成收集。

老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记-清理或者标记-整理算法来进行回收。

垃圾收集器

垃圾收集器就是内存回收的具体实现,目前有7种作用于不同分代的收集器:

serial收集器、parnew收集器、parallel scavenge收集器、serial old收集器、parnew old收集器、cms收集器、g1收集器。

Serial收集器:

是一个单线程的收集器,使用一条收集线程去完成垃圾收集的工作,并且在进行垃圾回收时,必须暂停它所有的其他工作线程,直到收集结束。

这个暂停的过程叫:Stop The World,停顿对用户的体验不够好,但某种程度上来说也是合理的,后续不断有新的垃圾收集器出现,正在不断的缩短用户线程的停顿时间。

Serial收集器的运行示意图如下所示:
在这里插入图片描述

ParNew收集器:

ParNew收集器其实就是Serial收集器的多线程版本,除了使用多条线程进行垃圾收集之外,其余和Serial一致。
ParNew收集器的运行示意图如下所示:
在这里插入图片描述

默认开启的收集线程数与CPU的数量相同,在CPU核数多的情况下,可以使用-XX:ParallelGCThreads参数来限制垃圾收集的线程数。

Parallel Scavenge收集器:

新生代收集器,使用复制算法,并行的多线程收集器。
特点在于:关注点和其他收集器不同,CMS等收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目标是达到一个可控的吞吐量。也被称为“吞吐量优化”收集器。
适合在后台运算而不需要太多交互的任务。

吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)。

Serial Old收集器:

Serial Old是Serial收集器的老年代版本,同样是一个单线程收集器,使用标记-整理算法。

过程如上Serial收集器运行图。

Parallel Old收集器:

Parallel Old是Parallel Scavenge收集器的老年代版本,使用多线程和标记-整理算法。
在这里插入图片描述

CMS收集器:

CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。
基于标记-清除算法实现,分为4个步骤:

  • 初始标记(CMS initial mark)
  • 并发标记(CMS concurrent mark)
  • 重新标记(CMS remake)
  • 并发清除(CMS concurrent sweep)

初始标记、重新标记这两个步骤需要Stop The World。初始标记仅仅是标记一下GC Roots能直接关联到的对象,速度很快,并发标记阶段就是进行GC Roots Tracing的过程,而重新标记阶段是为了修正并发标记期间因用户程序继续运行而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间一般比初始标记稍长,但远比并发标记的时间短。

由于整个过程中耗时最长的并发标记和并发清除过程收集线程可以和用户线程一起工作,所以,总体来说,CMS收集器的内存回收过程是与用户线程一起并发执行的。如下图所示:
在这里插入图片描述
缺点:

1、对CPU资源比较敏感,在并发阶段,容易抢占一部分线程而导致应用程序变慢;
2、无法处理浮动垃圾:因并发清理阶段用户线程还在运行,会产生新的垃圾,这一部分垃圾出现在标记过程之后,只能下次再收集;
3、会产生大量的空间碎片。

G1收集器

最新的垃圾收集器,与其他GC收集器相比,具有下面特点:

  • 并行与并发:G1收集器可以通过并发方式让Java程序继续执行;
  • 分代收集:G1可以独立管理整个GC堆;
  • 空间整合:基于标记-整理算法实现,不会产生内存空间碎片;
  • 可预测的停顿:G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。

可以划分为下面几个步骤:

  • 初始标记(Initial Marking)
  • 并发标记(Concurrent Marking)
  • 最终标记(Final Marking)
  • 筛选回收(Live Data Counting and Evacuation)

初始标记阶段只是标记一下GC Roots能直接关联到的对象,这个阶段停顿线程,但耗时很短;
并发标记阶段是从GC Root开始对堆中对象进行可达性分析,找出存活对象,这阶段耗时较长,可与用户程序并发执行。
最终标记阶段是为了修改并发标记期间发生的变动;
筛选回收阶段可以根据用户所期望的GC停顿时间来制定回收计划。

如下图所示:

在这里插入图片描述

内存分配与回收策略

  1. Java堆=老年代+新生代;
  2. 新生代=Eden+S0+S1;
  3. 当Eden区的空间满了,Java虚拟机会触发一次Minor GC,以收集新生代的垃圾,存活下来的对象,则会转移到Survivor区;
  4. 大对象直接进入老年代(需要大量连续内存空间的Java对象,如很多的字符串);
  5. 如果对象在Eden出生,并经过第一次Minor GC后仍然存活,并且被Survivor容纳的话,年龄设为1,每熬过一次Minor GC,年龄+1,若年龄超过一定限制(15),则被晋升至老年代。即长期存活的对象进入老年代。
  6. 当老年代满了而无法容纳更多的对象,Minor GC之后通常会进行Full GC,Full GC清理整个内存堆-包括新生代和老年代。

小结

几种垃圾回收器:

Serial收集器:单线程的收集器,收集垃圾时必须stop the world,使用复制算法;
ParNew收集器:Serial收集器的多线程版本,也需要stop the world,复制算法;
Parallel Scavenge收集器:新生代收集器,复制算法,并发的多线程收集器,目标是达到一个可控的吞吐量;
Serial Old收集器:是Serial收集器的老年代版本,单线程收集器,使用标记整理算法;
Parallel Old收集器:是Parallel Scavenge收集器的老年代版本,多线程,标记整理算法;
CMS收集器:是一种以获得最短回收停顿时间为目标的收集器,标记清除算法;运作过程:初始标记-并发标记-重新标记-并发清除,收集结束会产生大量的空间碎片;
G1收集器:标记整理算法,运作过程:初始标记-并发标记-最终标记-筛选回收。不会产生空间碎片,可以精准地控制停顿。

CMS和G1的区别:

CMS是老年代收集器,可以配合新生代Serial和ParNew收集器一起使用;
G1范围是新生代和老年代,不需要结合其他收集器使用;
CMS收集器以最小的停顿时间为目标;
G1收集器可预测垃圾回收的停顿时间;
CMS使用标记-清除算法,垃圾收集结束后容易产生内存碎片;
G1使用标记-整理算法,进行了空间整合,降低了内存空间碎片。

参考:
深入理解Java虚拟机:JVM高级特性与最佳实践

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值