python垃圾回收机制-----引用计数机制&标记清除机制

现在的高级语言如java,c#等,都采用了垃圾收集机制,而不再是c,c++里用户自己管理维护内存的方式。自己管理内存极其自由,可以任意申请内存,但如同一把双刃剑,为大量内存泄露,悬空指针等bug埋下隐患。

对于一个字符串、列表、类甚至数值都是对象,且定位简单易用的语言,自然不会让用户去处理如何分配回收内存的问题。
python里也同java一样采用了垃圾收集机制,不过不一样的是,python采用的是引用计数机制为主,标记-清除和分代收集两种机制为辅的策略。
引用计数机制:
python里每一个东西都是对象,它们的核心就是一个结构体:PyObject
  • 1
  • 2
  • 3
  • 4
  • 5
        typedef struct_object {
            int ob_refcnt;
            struct_typeobject *ob_type;
        }PyObject;
  • 1
  • 2
  • 3
  • 4
PyObject是每个对象必有的内容,其中ob_refcnt就是做为引用计数。当一个对象有新的引用时,它的ob_refcnt就会增加,当引用它的对象被删除,它的ob_refcnt就会减少
  • 1
  • 2


 ** #define Py_INCREF(op)   ((op)->ob_refcnt++)          //增加计数**

 **define Py_DECREF(op)                             //减少计数       **

     if (--(op)->ob_refcnt != 0)    \

         ;        \

     else         \

         __Py_Dealloc((PyObject *)(op))
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

引用计数为0时,该对象生命就结束了。 
引用计数机制的优点: 
1、简单 
2、实时性:一旦没有引用,内存就直接释放了。不用像其他机制等到特定时机。实时性还带来一个好处:处理回收内存的时间分摊到了平时。 
引用计数机制的缺点: 
1、维护引用计数消耗资源 
2、循环引用

1
list1 = []
2
list2 = []
3
list1.append(list2)
4
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

list2.append(list1) , list1与list2相互引用,如果不存在其他对象对它们的引用,list1与list2的引用计数也仍然为1,所占用的内存永远无法被回收,这将是致命的。 
对于如今的强大硬件,缺点1尚可接受,但是循环引用导致内存泄露,注定python还将引入新的回收机制。

上面说到python里回收机制是以引用计数为主,标记-清除和分代收集两种机制为辅。

1、标记-清除机制

标记-清除机制,顾名思义,首先标记对象(垃圾检测),然后清除垃圾(垃圾回收)。如图1:

这里写图片描述

                        图1
  • 1
  • 2

首先初始所有对象标记为白色,并确定根节点对象(这些对象是不会被删除),标记它们为黑色(表示对象有效)。将有效对象引用的对象标记为灰色(表示对象可达,

但它们所引用的对象还没检查),检查完灰色对象引用的对象后,将灰色标记为黑色。重复直到不存在灰色节点为止。最后白色结点都是需要清除的对象。

2、回收对象的组织

这里所采用的高级机制作为引用计数的辅助机制,用于解决产生的循环引用问题。而循环引用只会出现在“内部存在可以对其他对象引用的对象”,比如:list,class等。

为了要将这些回收对象组织起来,需要建立一个链表。自然,每个被收集的对象内就需要多提供一些信息,下面代码是回收对象里必然出现的。

一个对象的实际结构如图2:

这里写图片描述

                       图2
  • 1
  • 2

通过PyGC_Head的指针将每个回收对象连接起来,形成了一个链表,也就是在1里提到的初始化的所有对象。

3、分代技术

分代技术是一种典型的以空间换时间的技术,这也正是java里的关键技术。这种思想简单点说就是:对象存在时间越长,越可能不是垃圾,应该越少去收集。

这样的思想,可以减少标记-清除机制所带来的额外操作。分代就是将回收对象分成数个代,每个代就是一个链表(集合),代进行标记-清除的时间与代内对象

存活时间成正比例关系。

从上面代码可以看出python里一共有三代,每个代的threshold值表示该代最多容纳对象的个数。默认情况下,当0代超过700,或1,2代超过10,垃圾回收机制将触发。

0代触发将清理所有三代,1代触发会清理1,2代,2代触发后只会清理自己。

下面是一个完整的收集流程:链表建立,确定根节点,垃圾标记,垃圾回收~

1、链表建立 
首先,中里在分代技术说过:0代触发将清理所有三代,1代触发会清理1,2代,2代触发后只会清理自己。在清理0代时,会将三个链表(代)链接起来,清理1代的时,会链接1,2两代。在后面三步,都是针对的这个建立之后的链表。

2、确定根节点 
图1为一个例子。list1与list2循环引用,list3与list4循环引用。a是一个外部引用。

这里写图片描述

                                 图1
  • 1
  • 2

对于这样一个链表,我们如何得出根节点呢。python里是在引用计数的基础上又提出一个有效引用计数的概念。顾名思义,有效引用计数就是去除循环引用后的计数。 
希望本文所述对大家的Python程序设计有所帮助。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python垃圾回收机制是自动化的,它通过引用计数和循环垃圾收集两种方式来管理内存。 1. 引用计数Python中的每个对象都有一个引用计数器,用于记录有多少个引用指向该对象。当引用计数为0时,说明该对象不再被使用,可以被回收。当一个对象被赋值给一个新的变量时,引用计数会增加;当变量被删除或者超出作用域时,引用计数会减少。但是引用计数机制无法解决循环引用的问题。 2. 循环垃圾收集:为了解决循环引用的问题,Python还使用了循环垃圾收集机制。它通过标记-清除算法来检测和回收不再使用的对象。具体过程如下: - 首先,从根对象(如全局变量、活动函数栈等)开始,标记所有可以访问到的对象。 - 然后,清除所有未标记的对象,并回收它们所占用的内存空间。 - 最后,对内存空间进行整理,以便后续分配。 Python垃圾回收机制是自动触发的,当满足一定条件时,垃圾回收器会自动执行垃圾回收操作。这些条件包括: - 当内存达到一定阈值时; - 当对象的引用计数为0时; - 当程序调用了`gc.collect()`函数。 需要注意的是,Python垃圾回收机制是相对慢的,因为它需要遍历整个对象图来进行标记清除操作。因此,在编写Python程序时,应尽量避免产生大量的临时对象和循环引用,以提高程序的性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值