从头开始学习JVM(五)—— 垃圾回收算法

JVM(Java Virtual Machine)即Java虚拟机,Java代码都是在JVM上运行的,所以了解JVM是成为Java高手的毕竟之路。

本系列内容将对JVM的知识进行介绍,是从头学习JVM知识的笔记。

本系列内容根据自己的学习和理解的基础上,并参考《深入理解Java虚拟机》一书介绍的知识所写。如果有写的不对的地方,请各位多多提点。



垃圾回收算法

虚拟机的垃圾回收算法有以下四种:引用计数法、标记-清除算法、复制算法、标记-整理算法。

引用计数法

引用计数法,即在对象创建的时候给对象添加一个引用计数器,每当有一个引用时就加1,当引用失效时减1,若为0 表明此对象已经不会再被使用,则进行回收。JVM中并未使用该种算法,仅作为介绍。

  • 优点

简单,计算代价小,幽灵时间短(指对象从死亡到被回收的这段时间,叫做幽灵时间)。

  • 缺点

计数器需占用额外的控件,并发支持弱,且不全面(无法清除循环引用的对象)。

标记清除算法

最基础的收集算法是“标记-清除”(Mark-Sweep)算法,算法分为“标记”和“清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收已标记的对象。说它是最基础的原因是,后面的算法都是根据此进行改进的。
标记清除算法

  • 优点

节省空间,清除得比较全面。

  • 缺点

一是效率问题,标记与清除都需要遍历,效率不高;二是空间问题,清楚后会遗留不连续的内存块,对以后分配大内存时因为内存不足提前引发另一次垃圾回收过程。

复制算法

复制(Copying)算法是在标记-清除清除的算法基础上,为了提高效率而出现的算法。它将内存空间分为容量大小相同的两块,每次只使用一块。当一部分用完时,就将还存活的对象复制到另一半上面去,然后再把刚才用过的那一半一次清理掉。这样使得每次只是对整个半区进行内存回收,保证了另一半一定是空余的。JVM堆内存里新生区中的幸存区用的就是复制算法。
复制算法

  • 优点

实现简单,没有内存碎片。

  • 缺点

占用空间,总有一半空间是空余的。当对象存活率较高时,复制操作过多会降低效率。

标记整理算法

标记-整理(Mark-Compact)算法是根据老年区的特性,对标记-清除算法的改进。它也分为两个步骤:首先标记出所有需要回收的对象,然后是整理,即将存活的对象都向一端移动,再统一回收。
标记整理算法

  • 优点

不会产生内存碎片。

  • 缺点

若存活对象较多,则整理过程比较耗时。

汇总与比较

三种回收算法汇总

算法名称操作过程优点缺点
标记-清除(Mark-Sweep)首先标记出所有需要回收的对象,在标记完成后统一回收已标记的对象。节省空间,清除得比较全面。效率和空间问题;标记与清除都需要遍历,效率不高;回收后空间不连续。
复制(Copying)划分两等份内存空间,一半空余,先用一半,满了之后将存活的对象复制到另一半然后一次性清除。实现简单,没有内存碎片。占用空间;若存活对象较多复制耗时。
标记-整理(Mark-Compact)首先标记出所有需要回收的对象,然后即将存活的对象都向一端移动,再统一回收。不会产生内存碎片若存活对象较多,则整理过程比较耗时。

三种算法比较

比较内容顺序
效率(时间复杂度)复制 > 标记清除 > 标记整理
整齐度复制 = 标记整理 > 标记清除
内存利用率标记整理 = 标记清除 > 复制


分代收集算法

分代收集(Generational Collection)算法是根据对象的存活周期将内存划分为几块。Java堆一般划分为新生区和老年区,根据不同的算法特点选择合适的收集算法。当前的虚拟机基本上都采用的分代算法。

具体的Java堆内存的划分可参考之前的文章: 从头开始学习JVM(二)—— Java堆划分及对象的产生.

  • 在新生区中,对象存活率低,因此一般采用复制算法,每次回收只需要付出少量的复制成本即可。
  • 在老年区中,对象存活率高,没有额外的空间可供分配已担保,所以是 标记清除 配合标记 标记整理算法 来进行回收。

回收方法区

很多人认为方法区(或者说永久区)中是没有垃圾收集的,Java虚拟机规范中确实说过可以不要求在方法区实现垃圾收集,而且在方法区中回收的“性价比”比较低。不过方法区中是有内容可以回收的。

永久区垃圾回收主要两部分内容:废弃的常量和无用的类。

判断废弃常量:一般是判断该常量没有引用。

判断无用的类,要以下三个条件都满足:

  1. 该类所有的实例都已经回收,也就是 Java 堆中不存在该类的任何实例。
  2. 加载该类的 ClassLoader 已经被回收。
  3. 该类对应的 java.lang.Class 对象没有任何地方被引用,无法在任何地方通过反射访问该类的方法。

满足了以上3个条件的“无用的类”就是可以回收的,但不一定会被回收。虚拟机提供了参数 -Xnoclassgc 控制对类的回收。还可以使用 -verbose:class 以及 -XX:+TraceClassUnLoading 查看类加载和卸载信息。其中 -verbose:class 以及 -XX:+TraceClassUnLoading 参数可以在 Product版的虚拟机使用,-XX:+TraceClassUnLoading 参数需要 FastDebug 版的虚拟机支持。

在大量使用反射、动态代理、GCLib等ByteCode框架、动态生成JSP以及OSGi这类频繁自定义ClassLoader的场景都需要虚拟机具备类卸载的功能,以保证永久代不会溢出。


JVM的算法实现

虚拟机在实现回收算法时,必须对算法的执行效率有严格的考量,才能保证虚拟机的高效运行。

根节点的扫描

从可达性分析可以知道对象是否存活是从 GC Roots 这个根节点进行查找的,GC Roots 节点主要在 全局性的引用(例如常量或类静态属性) 和 执行上下文(例如栈帧中的本地变量表)中,若要逐个检查引用则需要耗费过多的时间。

另外,为了保证可达性的准确性,就会有GC停顿现象(将所有线程停顿,称为Stop The World),即使是在号称(几乎)不会发生停顿的CMS收集器重,至少计算出根节点的时候也是要停顿的。

为了解决这个问题,HotSpot是使用一组称为OopMap的数据结构来解决的,在类加载完成的时候,虚拟机就把对象内偏移量上的数据类型计算出来;在JIT(即时编译)过程中,也会在 特定的位置 记录下栈和寄存器中引用的位置。这样,GC(垃圾回收)在扫描时就可以通过OopMap数据得知这些信息了,在OopMap的协助下,虚拟机可以快速且准确的完成GC Roots的扫描。

安全点

引用是会发生变化的,或者变化发生频繁,如果虚拟机为把每条引用(包括变化)都存储在OopMap中,会需要大量的额外空间,提高了GC的成本。实际上,虚拟机也没有在OopMap中记录每条引用信息,只是在“特定位置”记录,这些位置就称为“安全点”(Safepoint)。

即程序在运行过程中,只有达到安全点才会停顿下来开始GC。

但是安全点也不能太少或者太多,会影响GC的效率。所以安全点的选定基本上是以程序的 “具有让程序长时间执行的特征” 为标准选定的。长时间执行的明显特征就是指 指令序列复用,例如方法调用、循环跳转、异常跳转等,具有这些指令才会产生安全点。

对于安全点,在GC发生时让所有线程(这里不包括执行JNI调用的线程)都“跑”到最近的安全点再停顿的方案有两种:抢断式中断(Preemptive Suspension) 和 主动式中断(Voluntary Suspension)。

  • 抢断式中断

在GC发生时,首先让所有线程中断,如果线程不在安全点则恢复线程,让他“跑”到安全点上。抢断式中断不需要线程的执行代码主动去配合,目前几乎没有虚拟机采用抢断式中断来暂停线程去响应GC事件了。

  • 主动式中断

当GC需要中断线程的时候,不直接对线程进行操作,仅仅简单的设置一个标志,各个线程执行时主动去轮询这个标志,发展中断标志为真则自行中断挂起。轮询标志和安全点是重合的。

安全区域

若线程处于 Waiting(Timed_Waiting)状态或者 Blocked 状态时,线程是无法响应JVM的中断请求的,对于这种状况就需要安全区域(Safe Region)来解决。

安全区域是指在一段代码片段中,引用关系不会发生变化。在这个区域中的任意地方开始GC都是安全的。也可以称为是扩展了的安全点。

当线程执行到安全区域中的代码时,首先标识自己 已经进入了安全区域,这段时间内可以发起GC或根节点扫描。在线程要离开安全区域时,需要检查系统是否已经完成了根节点的扫描(或者整个GC过程),如果完成了就可以离开,否则就必须等到收到离开信号为止。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值