HotSpot的算法实现
枚举根节点
从可达性分析中从 GC Roots 节点找引用链这个操作为例。GC Roots 节点主要在全局性的引用(常量或者类静态属性) 与执行上下文(栈帧中的本地变量表)中,如果逐个检查这里面引用,那么必然会消耗很多时间。
另外,可达性分析对执行时间的敏感体现在 GC 停顿上。
什么是 GC 停顿
GC 进行时必须停顿所有java执行线程 (Stop The World),即使是号称不会发生停顿的CMS收集器中,枚举根节点时也是必须要停顿的。
为什么要 GC 停顿
可达性分析必须在一个能确保一致性的快照中进行------一致性的意思是整个分析期间整个执行系统看起来就像被冻结在某个时间点上,不可以出现分析过程中对象引用关系还在不断变化的情况,该点不满足的话分析结果准确性就无法得到保证。
什么是准确式内存管理 、准确性 GC
准确式内存管理(Exact Memory Management,也可以叫 Non-Conservative/Accurate Memory Management),即虚拟机可以知道内存中某个位置的数据具体是什么类型。例如 内存中有一个32位的整数123456,它是一个reference 类型指向123456 的内存地址还是一个数值为123456的整数,虚拟机有能力分辨出来,这样才能在 GC 的时候准确判断堆上的数据是否还可能被使用。
停顿之后
执行系统停顿下来后,并不需要一个不漏的检查完所有执行上下文和全局的引用位置,虚拟机当是有办法直接得知哪些地方存放着对象引用,
HotSpot 的实现中,是使用一组称为 OopMap 的数据结构来达到这个目的,在类加载完成的时候,HotSpot 就把对象内什么偏移量上是什么类型计算出来,在JIT编译过程中会在特定的位置记录下栈和寄存器中哪些位置是引用。这样,GC扫描时就可以直接得知这些信息了。
安全点
在OopMap的协助下, HotSpot 可以快速且准确的完成 GC Roots枚举,但是如果为每条指令都生成对应的 OopMap,那将需要大量的额外空间。
HotSpot 并没有为每条指令都生成 OopMap,只是在特定的位置 记录了这些信息,这些位置称为安全点(SafePoint),也就是说,程序执行时,并不是每个地方都能停顿下来开始GC,只有到达安全点才能暂停.
SafePoint 的选定既不能太少以至于让GC等待时间太长,也不能太过频繁以至于过分增大运行时的负荷。
安全点的选定基本上是以程序 “是否具有长时间执行的特征” 为标准进行选定的,因为每条指令执行的时间都非常短暂,程序不太可能因为指令流长度太长这个原因而长时间运行,长时间执行 的最明显特征就是指令复用,例如方法调用,循环跳转,异常跳转等,所以具备这些功能的指令才会产生SafePoint.
GC 发生时怎么让所有线程(不包括执行JNI调用的线程) 都跑 到最近的安全点再停顿下来?
- 抢先式中断(Preemptive Suspension)
不需要线程的执行代码主动去配合,在GC发生时,首先把所有线程全部中断,如果发现有线程中断的地方不在安全点上,就恢复线程,让 它 跑到安全点上。现在几乎没有虚拟机这么干。 - 主动式中断(Voluntary Suspension)
当GC需要中断线程的时候,不直接对线程操作,仅仅简单的设置一个标志,各个线程执行时主动去轮询这个标志,发现中断标志为真时就自己中断挂起,轮询标志的地方和安全点重合。
安全区域(Safe Region)
安全点的不足
当程序不执行的时候,就不会进入GC 的 SafePoint .程序不执行的意思是指 没有分配CPU时间片。例如:线程处于Sleep状态 或者 Blocked 状态,这时候线程无法响应JVM 的中断请求,走到 安全点去中断挂起,JVM 显然也不能等待线程重新被分配CPU时间。这时候就需要安全区域(Safe Region)来解决。
什么是安全区域
安全区域是指在一段代码之中,引用的关系不会发生变化。在这个区域的任意地方开始GC 都是安全的。可以把 Safe Region 看出扩展后的 SafePoint
安全区域中的线程怎么响应中断的
当线程执行到 Safe point 中的代码时,首先标识自己已经进入了 Safe Region,当在这段时间里JVM 要发起GC时,就不用去管标识自己为Safe Region状态的线程了,当线程要离开Safe Region时,它要检查系统是否已经完成了根节点枚举(或者是整个GC 过程),如果完成了就继续执行,否则就要等待收到可以安全离开Safe Region的信号为止。
参考资料
学习摘抄于深入理解Java虚拟机