Garbage Collection | 引用计数的改善考察（一）

最新推荐文章于 2024-09-21 16:35:48 发布

sweeterer

最新推荐文章于 2024-09-21 16:35:48 发布

阅读量1.1w

点赞数 2

分类专栏： Garbage Collection Garbage Collection 文章标签：递归对象算法内存指针

本文链接：https://blog.csdn.net/sweeterer/article/details/52798426

版权

Garbage Collection 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

Garbage Collection

6 篇文章 3 订阅

订阅专栏

1 非递归的释放

之前的博文中，所介绍的简单的引用计数算法中，每当指向某个对象的指针被改写的时候，Update过程就会减小那个对象的引用计数数值。如果计数值变为0，那么在将该对象所占据的内存归还给自由链表之前，必须递归地删除这个对象所包含的指针。因此，简单的递归释放在散布处理开销时并不均匀：删除指向某个对象的最后一个指针的代价不是常数，甚至不是正比于对象大小，而是依赖于以改对象为根的子图的大小。

1.1 延迟释放算法

Weizenbaum提出了一个方法，把自由链表当作一个栈来使用，借此“平滑”释放动作【Weizenbaum ，1963】.当指向节点N的最后一个指针被删除时，系统简单地把N压入自由栈。此时并不进行递归释放。取而代之的，当要从自由栈顶取出N重新分配时，New例程会对N中的所有指针执行delete操作，如果其中某个指针指向的节点的引用计数值变为0，那么再把这个节点压入自由栈。有一点很重要：再单元入栈时，单元中所有指针域的内容都不能破坏。可以确定不再需要的只有引用计数域（因为如果单元时自由的，这个域一定为0），因此我们可以用它来把自由栈链接起来。通过推迟对垃圾的检测来实现延迟释放，我们可以沿用之前所给的算法中free跟Update的过程，只需要将用来链接自由链表的域从原先未指明的next域改成RC域即可。但是，New和delete过程则必须修改。此外，我们使用incremenrRC和decrementRC来抽象调整引用计数域的底层细节。这么做的原因将在本文第3段会给出。

//Weizenbaum 用于引用计数的延迟释放算法
New() =
    if free_list == null
        abort "Memory exhausted"
    newcell = allocate()
    for N in Children(newcell)
        delete(*N)
    RC(newcell) = 1
    return newcell

delete(N) =
    if RC(N) == 1
       RC(N) = free_list
       free_list = N
    else decrementRC(N)

1.2 延迟释放的优点和代价

延迟释放和原有的急切释放在效率上时相同的（执行的指令完全相同，只是从过程delete移到过程allocate中而已），但是算法不再那么容易受到被释放单元的后代所造成的延迟影响了。遗憾的是，这并不能完全解决处理开销不均匀的问题。如例，如果释放了一个数组，那么当它来到自由链表的顶部时，还是必须删除它的所有指针（虽然深度只有一层）；删除指针，调整自由栈所带来的延迟可大可小，视数组大小而定。Weizenbaum算法的延迟性也失去了标准引用计数的立即性所带来的某些好处。垃圾数据结构各部分所占据的内存会一直无法访问，直到整个数据结构在自由栈的栈顶被New过程移除为止。假设某个类型的对象分为对象头和对象体两部分，每个对象有一个较小的对象头表示，而这个对象头指向一个巨大的对象体。如果删除一个这样的对象，那么只有它的对象头会被压入到自由栈。如果另外再有几个对象也被删除并被压入自由栈的话，第一个被删除对象的对象体所占据的大量内存将不再视立刻可用的了。

2 延迟引用计数

在常规的赢家你上，维护引用计数值的开销很高。这使得引用计数作为一个内存管理机制不如基于追踪的方式那么具有吸引力。改写一个指针通常需要10几条指令，以调整指针所指向的旧目标和新目标的引用计数值。当指针被压入，或弹出系统栈的时候，也必须天正引用计数值。甚至视向遍历一个列表这样无破坏性的操作也必须在经过每个元素时先增大然后减少它的引用计数值。在现代的，拥有数据cache的突袭结构中，读取计数值的指令可能导致原本根本不会碰到的数据进入cache。这些数据会被污染，从而必须写回堆内存，尽管他们的值和把它们放入cache中时完全一样。更坏的结果是，操纵引用计数值可能导致保存对象的内存页面被换入。

减小这个开销的唯一途径，是抓住每个安全的机会避开堆计数值的调整。在手工编写的引用计数系统中，一个经常得到使用的技术是避免在进入和退出子例程时增大和减小参数的计数值。这只有在能够确定子例程的执行不会导致参数的计数值降为0时才是安全的。手工的引用计数优化很可能是以延长调试时间来换取缩短CPU时间。把优化其放入编译器中时隔更可靠的方案；在SISAL的并行实现中，这一方案已经被证明能够有效地消除对计数值的操作。非正统的系统类型也可能被用来识别单绪对象，使引用计数成为不必要的。Baker曾经鼓吹过使用基于线性逻辑的类型系统【Girard ，1987】，他视之为一个有效的技术，然而其他人却发现在实践中这一技术让人失望【Baker ，1994；Walkling ，1990】.函数式程序设计语言Clean采用了一个类似的unique types系统【Brusetal ，1987】.尽管这些系统要求程序员来识别单绪的对象，然而它们的type assertion的正确性能够有编译器来检查。

2.1 Deutsch-Bobrow算法

与那些试图通过编译时分析来消除对计数值的操作的人不同，Deutsch和Bobrow设计了一套系统化的运行时方法来推迟对引用计数值的调整【Deutsch and Bobrow ，1976】。在程序中，大部分的指针赋值都是将指针保存到某个局部变量中；有了现代的，优化的Lisp或ML编译器，其他的指针赋值的比率低于1%。延迟引用计数利用了这个发现，对局部变量和栈分配的编译器临时量进行特殊处理：当它们被改变时，不做任何引用计数的薄记工作。因此，将指针写入到局部的名字这一操作就能使用简单的赋值而非Update过程。现在引用计数值仅仅反应了来自堆中其他对象的引用数量：来自栈的引用并不计算在内。这意味着我们不再能够在对象的计数值降为0时同时回收它们了，因为它们仍然可能通过某个局部变量或者临时变量直接到达。取而代之的是，delete将计数值变为0的单元放入一个名未“zero count table”的表中（简称ZCT）。ZCT通常以一个哈希表或者位图来实现。

当指向ZCT中某个对象的指针被保存到另一个堆对象中时，系统会增大它的计数值并删除ZCT中对应的条目。收集器周期性地核对ZCT以回收垃圾。任何对象，如果ZCT中存在指向它的引用，而且在扫描栈时也无法找到它，那么这个对象一定是垃圾，可以送回自由链表了。核对工作分为3个阶段：首先标记所有可以从栈直接访问的对象，接着释放ZCT中所有未被标记的对象。最后将所有被标记对象的标记擦去。

//延迟引用计数：更新指针值
delete(N) =
    decrementRC(N)
    if RC(N) == 0
       add N to ZCT

Update(R ,S) //R和S是堆中对象
    incrementRC(S)
    delete(*R)
    remove S from ZCT
    *R = S

标记对象和清除对象白哦及的方法质疑是分别增大和减小它们的引用计数域。ZCT中的对象，如果它真的是垃圾，那么在增大了所有可以直接从栈到达的对象计数值之后，它的计数值一定还是0.在对这些对象所保存的全部指针执行delete操作之后，旧可以释放它们了。最后，在第一阶段过程中增大了的引用计数值，必须相应的减小。

//延迟引用计数：核对ZCT
reconcile() =
    for N in stack
        incrementRC(N) //标记栈中对象
    for  N in ZCT   //回收垃圾
        if RC(N) == 0
           for M in Children(N)
               delete(*M)
           free(N)
    for N in stack  //清除栈中对象标记
        decrementRC(N)

2.2 ZCT溢出

要是ZCT在溢出的时候进行核对，递归地释放对象可能在每次释放一个对象时向ZCT中添加更多的条目。针对这个难题，有几种不同的解决方案。如果释放一个对象将会导致ZCT溢出，那么可以中断它的回收，把这个对象留在ZCT中，直到下一次核对。或者，我们可以采用Weizenbaum的延迟释放技术，在释放对象时并不删除它所保存的各个指针，直到这个对象被重新分配。系统可以在分配动作即将导致溢出时核对ZCT。又或者，如果用位图实现ZCT，那么溢出旧不再成为一个问题。在我们讨论垃圾收集时，位图一般是指由二进制位构成的数组，每一位代表了堆中的一个字。系统通过设置和清除对应于某个对象的二进制位来代表这个对象进入或者离开ZCT。以一小部分堆空间为代价，我们可以完全省去对溢出的检查。

2.3 延迟引用计数的效率

延迟引用计数在减小指针写的开销方面非常有效。20世纪80年代中期在Xerox Dorado上实现Smalltalk的经验标明，一般来说它能够把操作指针的开销降低80%甚至更多，而只要付出相对较小的空间上的代价。Ungar对标准引用计数系统和延迟引用计数系统中指针更新，核对，递归释放操作进行了比较。还声称核对ZCT所带来的停顿（没500ms停顿30ms）也要比那些mark-sweep垃圾收集带来的停顿要短。