第4章 G1的refine线程
RSet直接记录对象的地址,带来的问题是RSet会急剧膨胀
G1 回收器里面,使用了Point In 的方法,算法可以简化为找到需要收集的分区HeapRegion集合,所以YGC 扫描 RootSet 和 RSet就可以了
RSet 管理引用的方式,把引用者对象对应的卡表地址存放在RSet中,在Rset里面记录一个区域到这个对象所在分区的引用
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
4.2.1 抽样线程
设置新生代分区的个数,使G1满足垃圾回收的预测停顿时间
4.2.2 管理RSet
G1 中使用Refine线程异步地维护和管理引用关系,要异步处理,所以必须有一个数据结构来维护这些需要引用的对象
+++++++++++++++++++++++++++++++++++++++++++++++++++++++
4.3 Refinement Zone
4.4 RSet 涉及的写屏障
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
G1垃圾收集器之RSet
Region的大小只能是1M、2M、4M、8M、16M或32M,比如-Xmx16g -Xms16g
,G1就会采用16G / 2048 = 8M 的Region.
在赋值动作的前后,JVM插入一个pre-write barrier和post-write barrier,其中post-write barrier的最终动作如下:
其中_from是持有引用的对象所在的Region,to是引用对象所在的Region,通过add_reference方法加入到RSet中,更细节的实现在OtherRegionsTable::add_reference
方法中
Region1的根对象A,引用了Region2的对象B。 则Region2的RSet会记录下来这个引用关系,确定B是活跃的对象,黑色
而不需要扫描整个Region1或者其他Region后,才能确定B是活跃的
RSet
全称是Remembered Set,是辅助GC过程的一种结构,典型的空间换时间工具,和Card Table有些类似。还有一种数据结构也是辅助GC的:Collection Set(CSet),它记录了GC要收集的Region集合,集合里的Region可以是任意年代的。在GC的时候,对于old->young和old->old的跨代对象引用,只要扫描对应的CSet中的RSet即可。
逻辑上说每个Region都有一个RSet,RSet记录了其他Region中的对象引用本Region中对象的关系,属于points-into结构(谁引用了我的对象)。而Card Table则是一种points-out(我引用了谁的对象)的结构,每个Card 覆盖一定范围的Heap(一般为512Bytes)。G1的RSet是在Card Table的基础上实现的:每个Region会记录下别的Region有指向自己的指针,并标记这些指针分别在哪些Card的范围内。 这个RSet其实是一个Hash Table,Key是别的Region的起始地址,Value是一个集合,里面的元素是Card Table的Index