Java虚拟机如何快速找到GC Roots

文章介绍了Java虚拟机如何快速找到GCRoots,主要依赖于OopMap来记录对象引用,以及通过安全点(SafePoint)来确保在正确位置中断线程。临时GCRoots如RememberedSet用于处理跨代引用。线程中断有两种方式:抢断式中断和主动式中断,现代虚拟机多采用主动式中断。此外,安全区域(SafeRegion)解决了线程在非执行状态时的中断问题,确保在安全区内引用关系不会变化。
摘要由CSDN通过智能技术生成

Java虚拟机如何快速找到GC Roots

我们知道大多数的垃圾收集器在在收集垃圾的时候会停顿所有的线程(Stop The World)来进行可达性分析,那么如何快速找到GC Roots?线程应该在什么地方停止呢?

一、快速找到GC ROOTS

GC ROOTS分固定的GC ROOTS对象和临时GC ROOTS对象:

固定GC ROOTS (OopMap):

首先,为了保证结果的准确性,GC Roots 枚举时是要在 STW 的情况下进行的,但是由于 Java 应用越来越大,所以也不能逐个检查每个对象是否为 GC Root,那将消耗大量的时间;
一个很自然的想法是,能不能用空间换时间,在某个时候把栈上代表引用的位置全部记录下来,这样到真正 GC 的时候就可以直接读取,而不用再一点一点的扫描了。事实上,大部分主流的虚拟机也正是这么做的,比如 HotSpot ,它使用一种叫做 「OopMap」 的数据结构来记录这类信息。
在这里插入图片描述

OopMap存储两种对象引用:
1、对象内的引用

在类加载完的时候,HotSpot就把对象内什么偏移量上是什么类型的数据计算出来。

2、栈、寄存器中引用

在JIT编辑过程中,也会在特定的位置记录下栈和寄存器中哪些位置是引用。这样,GC在扫描的时候就知道这些信息了。

通过OopMap垃圾收集器就可以更快的找到GC Roots,并且更快的完成GC Roots的枚举。

临时GC Roots

为什么会有临时的 GC Roots ?
目前的垃圾回收大部分都是分代收集和局部回收,如果只针对某一部分区域进行局部回收,那么就必须要考虑的当前区域的对象有可能正被其他区域的对象所引(跨代引用),这时候就要将这部分关联的对象也添加到 GC Roots 中去来确保根可达算法的准确性。
事实上,对于位于不同年代对象之间的引用关系,虚拟机会在程序运行过程中给记录下来。“老年代对象引用新生代对象”这种关系,会在引用关系发生时,在新生代边上专门开辟一块空间记录下来,这就是 RememberedSet 。所以“新生代的 GC Roots ” + “ RememberedSet 存储的内容”,才是新生代收集时真正的 GC Roots 。

二、线程中断点:安全点(Safe Point)

1、定义

安全点就是程序能够停顿的位置。即程序不是在任何时候停顿下来进行GC,只有到了安全点才去更新OopMap和停顿,等待GC完成在继续执行。

2、分析

有了OopMap,HotSpot就能很快的完成GC Roots的枚举了。但是问题来了,每一行代码都有可能使引用变化,就需要更新OopMap,在哪个位置去更新OopMap呢?如果每一行都执行一次更新,肯定是不科学的,所以就有了安全点(safe point)。

安全点设置太多肯定不行,造成运行压力,太少的话两个点之间太长,如果刚过第一个安全点然后要求GC,但是程序要运行到下一个安全点才能停下来,那么GC等待的时间就太长了。

3、安全点选择标准

是否就有让程序长时间执行的特征。一条指令执行时间都很短,而一段程序一般不会说因为很长的指令流而造成长时间的运行,所以一般都是在指令复用的地方出现。比如:方法调用、循环跳转、异常跳转。

三、让线程停下来的两种方法

1、抢断式中断

在GC发生时,中断直接所有线程,发现没有在安全点的,再恢复线程让他跑到安全点。现在几乎没有虚拟机采用这种方式。

2、主动式中断

当GC需要中断线程时,设置一个标志,各个线程去轮询这个标志,发现需要中断,线程就自己中断。轮询点和安全点在一个地方,在加上创建对象需要分配内存的地方。

实现方式:

设置一个内存不可读,当线程访问这个内存就会产生一个自陷异常信号,预先注册的异常处理器中捕获这个异常暂停线程。通过一个指令和一个异常处理器就实现了这个功能。

四、休眠线程如何中断:安全区域(Safe Region)

1、安全点不能解决的问题

安全点解决了正在执行的线程中断问题,我们知道线程还有没执行的状态,比如线程是Sleep、Blocked状态。这些线程不能自己走到安全点。如果休眠的线程在GC途中醒来,在线程运行到安全点之前就会有可能修改对象的引用关系。所以我们需要在线程醒来的时候如果正在GC那么也中断。

2、安全区域

安全区域就是在一段代码中引用关系不会发生变化。所以在这个区域内任何地方GC都是安全的。在执行到安全区的时线程会标识自己处于安全区中,当离开安全区时,就需要检查系统是否已经完成枚举GC Roots(或者整个GC过程),如果已经完成那么线程继续执行,否则就等待。

3、安全区域举例

线程的Sleep、Blocked(这个区域内当前线程肯定不会改变对象引用)就被包含在安全区中,也就是说只要线程Sleep那么他就处于安全区,一旦Sleep时间到线程继续执行,首先就要判断是否能够离开安全区。

五、参考

Java虚拟机如何快速找到GC Roots?又是如何中断线程?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值