翻译自 : http://www.brpreiss.com/books/opus5/html/page424.html , 用于了解用于垃圾回收的标记清除算法.
标记清除算法是一种垃圾回收算法,它是第一个可以回收被循环引用的数据结构的垃圾回收算法.现在仍旧有许多常用的垃圾回收技术使用各种各样的标记清除算法的变体.
在使用标记清除算法时,未引用对象并不会被立即回收.取而代之的做法是,垃圾对象将一直累计到内存耗尽为止.当内存耗尽时,程序将会被挂起,垃圾回收开始执行.当所有的未引用对象被清理完毕时,程序才会继续执行.
标记清除算法又被叫做追踪式垃圾收集器,这是因为这种算法追踪被程序所引用的所有对象.在程序中可以直接访问的对象是指通过堆栈上的本地变量或者任意静态变量说引用的对象.从垃圾回收的角度来看,这种对象,叫做根(roots).如果一个对象是被另外的可(直接或者间接)访问的对象中的域引用,则这个对象可以被间接访问.可访问的对象被称为可用的(live),其他的对象被称为垃圾(garbage).
标记清除算法由两个阶段组成:
第一阶段,标记所有的可访问对象.第一阶段叫做标记阶段.
第二阶段,垃圾收集算法扫描堆并回收所有的未标记对象.第二阶段叫做收集阶段.
算法伪码如下:
for each root variable r
mark (r);
sweep ();
为了区分可用对象与垃圾对象,我们需要在每一个对象中记录对象的状态.因此,我们在每一个对象中加入了一个特殊的布尔类型的域,叫做marked.默认情况下,对象被创建时处于未标记状态.所以,marked域被初始化为false.
对象p以及所有间接引用对象p的对象可以被下面的递归标记算法所标记:
void mark (Object p)if (!p.marked)
p.marked = true; for each Object q referenced by p mark (q);
在第二阶段,标记清除算法扫描堆上的所有对象,主要是为了定位所有未被标记的对象.分配给未被标记(即marked=false)的对象的存储空间将会被回收.同时,可用对象的marked域将会被设置回false,以为下一次标记清除算法时做准备.
void sweep ()for each Object p in the heap
if (p.marked) p.marked = false else heap.release (p);
下面的图示解释了标记清除算法所执行的操作.图示(a)为垃圾回收执行之前的状态.在这个例子中,是一个单一根变量.图示(b)为执行mark阶段之后的状态.在这个阶段,所有可用的对象都被标记了.最后,在图示(c)中,被标记为false的对象被清理了,可用的对象(live)留了下来,并且所有可用(live)对象的marked域都被置成了false.
图示 : 标记清除式的垃圾回收
因为标记清除式的垃圾回收跟踪了由根(root)访问的所有对象,所以即使是在有循环引用时,它也可以正确的标记并执行垃圾回收工作.这是标记清除式垃圾回收与前一章所说的引用计数式垃圾回收相比,最主要的一个优势.标记清除的第二个优点是,对于引用对象的常规操作不会产生任何的额外开销.
标记清除方法的主要缺点是,当垃圾回收算法执行时,正常的程序会被挂起.特别是,如果一个程序是交互式程序或者正在有一些实时运算时,这就会成为一个问题.比如,一个正在进行垃圾回收的交互式程序会周期的无响应.