一、什么是垃圾回收
检测“陈旧”对象的进程,释放用于这些对象的内存空间,并返回回收空间到空闲表中,这一过程称为垃圾回收。
这一内存管理的负担被Python设计者交给了解释器来完成。
(而在有些语言中(如C或者C++),明确规定对象的存储空间由程序员释放。)
二、相关概念
1、活动对象
要访问程序中的一个对象时,它必须有该对象的直接或间接引用。这种拥有直接或间接引用的对象被称为活动对象
在定义活动对象时,对象的直接引用是以标识符的形式存在于活跃的命名空间(全局命名空间,或任何函数的本地命名空间)。
例如执行 a = A()
后,标识符a将作为新的A对象的引用在当前的命名空间定义。
活动对象还能进行以下的区分:
- 根对象
能直接引用的这种对象叫根对象(即上例中的a) - 对象的间接引用
发生在一些其他活动对象的状态中的引用或(即,若a实例包含一个列表属性,这个列表也是一个活动对象,因为它可以通过标识符a间接达到)(同时,a引用的列表中的任何对象也归为活动对象)
2、活动对象的引用计数
- 引用计数
每个Python对象的状态都是一个整数,这个整数被称为引用计数,即计算机系统中任何地方的对象有多少次引用。
每次引用赋给这个对象时,引用计数递增,每次引用被重新分配给其他对象时,原对象的引用计数递减。
python解释器允许运行程序来检测一个对象的引用计数,通过系统模块中getrefcount
函数完成,该函数返回一个等于对象的引用计数的整数。(由于调用时,该函数的形参要赋给调用方的实参,所以当报告计数时,在函数的本地命名空间中有该对象的附加引用)
三、垃圾回收
1、简单规则:引用计数为0时销毁
对象绝不会自行销毁;然而当对象无法被获取时,可能会被当做垃圾回收。
如果一个对象的引用计数为0,显然意味着它不可能是活动对象。系统会立刻释放该对象(Cpython会在对象上调用__del__方法,如果定义了的话),或将其放置在准备释放的对象的队列中。
2、高级规则:标记-消除算法
当引用计数为0时,显然对象不是活动对象。
但更重要的是,要辨别一个有非0引用计数的对象是否没资格作为活动对象。
(例如,data标识了一个双链表,它的首尾节点此时也是活动对象。当data被分配给其他对象后,链表实例的引用计数变成0,但所有节点的引用仍为非0(为啥??),此时简单的垃圾回收规则会阻止节点被回收)
因此,几乎每隔一段时间,特别是当内存堆中的可用空间越来越少时,Python解释器就会使用垃圾回收的更高级形式收回不可达的对象,尽管他们的引用计数不为0。
- 标记-消除算法
在这个算法中,我们设置一个“标记”位来标识每个对象是否是活动对象。
当确定需要垃圾回收时
step1:暂停其他所有活动,清除当前在内存堆中分配的所有对象的标志位
step2:标记阶段,在此阶段中,我们标记所有活动对象。
通过跟踪活跃的命名空间,标记所有根对象为活动对象;
标记所有其他的,从根对象可达的活动对象(通过对象引用及其他对象所定义的有向图进行深度优先搜索)。
step3:清除阶段,通过内存堆扫描并回收未被标记的对象正在使用的任何空间。
step4:当清除完成时,恢复运行暂停的程序
该方法面临一个挑战,即,我们是由于内存不足而进行垃圾回收,因此在垃圾回收期间不要使用额外的空间。
而在“标记”阶段,我们使用的算法(DFS??)是以递归执行的,空间复杂度正比与图的定点数,因此可能没有这么多内存可以使用。
因此我们需要找到一种就地执行DFS的方法,即用固定的额外空间来执行DFS。
就地执行DFS:待更新,还没仔细看