【python】垃圾回收机制:原理(一)

Python的垃圾回收机制是自动进行的,它基于多种策略来确保不再使用的内存空间得到回收,从而防止内存泄漏。以下是Python垃圾回收机制的主要组成部分及其工作原理的详细解释:

目录

一、引用计数(Reference Counting)

1、计数

2、示例

二、标记-清除(Mark-Sweep)

1、标记-清除机制

(1)标记阶段(Mark Phase)

(2)清除阶段(Sweep Phase)

(3)优点和缺点

三、分代收集(Generational Collection)

四、循环垃圾收集(Cyclic Garbage Collection)

1、工作原理

五、总结


一、引用计数(Reference Counting)

  • 原理:Python中的每个对象都有一个引用计数字段,记录着该对象被引用的次数。每当一个对象被引用时,引用计数增加;当一个引用被删除或超出作用域时,引用计数减少。当引用计数达到0时,该对象被视为不再被使用,其占用的内存空间可以被回收。
  • 问题:虽然引用计数法简单直接,但它存在两个问题。
    • 首先,维护引用计数需要额外的操作,这可能会降低程序的执行效率。
    • 其次,引用计数无法解决循环引用的问题。循环引用是指两个或多个对象相互引用,形成一个闭环,导致它们的引用计数永远不会降为0,即使这些对象实际上已经不再被使用。

1、计数

  • 增加引用计数:当一个新的变量指向一个对象时,该对象的引用计数加 1。
  • 减少引用计数:当一个变量被重新赋值或删除时,它所引用的对象的引用计数减 1。

2、示例

a = [1, 2, 3]  # 列表的引用计数为 1
b = a          # 列表的引用计数增加到 2
del a          # 列表的引用计数减少到 1
del b          # 列表的引用计数减少到 0,列表的内存被释放

二、标记-清除(Mark-Sweep)

  • 目的:为了解决循环引用问题,Python引入了标记-清除算法。标记-清除(Mark-Sweep)机制 是垃圾回收算法中的一种常用方法。
  • 原理
    • 标记阶段:从根对象(如全局变量、活动栈等)开始,递归地遍历所有可达对象,并给它们打上标记。
    • 清除阶段:遍历整个堆内存,清除没有被标记的对象,并将这些对象的内存空间回收。
  • 作用对象:主要针对容器类型的对象,如列表、集合、字典等。

1、标记-清除机制

(1)标记阶段(Mark Phase)

  1. 从根开始:标记阶段从一组已知的“根”对象开始。在 Python 中,这些根对象通常包括全局变量、栈中的对象(如函数调用的局部变量)等。
  2. 递归遍历:从根对象开始,解释器会递归地遍历每个对象的所有引用,并标记所有遇到的对象为“可达的”(reachable)。这个过程会一直持续到没有新的可达对象被发现为止。
  3. 忽略循环引用:如果两个或多个对象之间存在循环引用(即它们相互引用对方),但它们都没有被根对象引用,那么这些对象在标记阶段将不会被标记为可达的。这是因为它们只能通过彼此来访问,而无法从根对象到达。

(2)清除阶段(Sweep Phase)

  1. 回收内存:在标记阶段完成后,解释器会遍历堆中的所有对象。任何未被标记为可达的对象都被认为是“垃圾”,它们的内存可以被安全地回收。
  2. 重置引用计数:在清除阶段,解释器可能会重置所有对象的引用计数(尽管这不是所有垃圾回收算法的必要步骤,但在某些实现中可能是这样的)。

(3)优点和缺点

优点:
  • 可以处理循环引用问题,因为可达性是基于从根开始的遍历,而不是简单的引用计数。
  • 可以回收不可达对象的内存,从而防止内存泄漏。
缺点:
  • 需要暂停程序的执行来执行垃圾回收,这可能会导致程序在运行时出现短暂的延迟或停顿。
  • 标记和清除过程可能需要遍历大量的对象,因此在堆中对象数量很多时可能会比较慢。

三、分代收集(Generational Collection)

  • 目的:为了提高垃圾回收的效率,Python采用了分代收集的策略。
  • 原理:Python将对象分为不同的“代”,新创建的对象属于第0代。随着垃圾回收的进行,存活下来的对象会被晋升到下一代。Python对不同代的对象采用不同的垃圾回收频率和策略。通常,新对象更可能是垃圾,所以Python会更频繁地检查年轻代的对象。

四、循环垃圾收集(Cyclic Garbage Collection)

  • 目的:专门用于处理由于循环引用导致的内存泄漏问题。在 Python 中,两个或多个对象相互引用,形成一个闭环,但都没有被外部对象(如全局变量、栈中的对象等)引用,这种情况被称为循环引用。
  • 工作方式:通常与标记-清除算法结合使用。

1、工作原理

  • 检测循环引用:Python 的垃圾回收器会定期运行一个检测循环引用的过程。这个过程会遍历所有对象,并检查它们之间的引用关系,以找出循环引用的对象组。

  • 标记阶段:在检测到循环引用后,垃圾回收器会启动标记过程。从根对象(如全局变量、栈中的对象等)开始,递归地遍历所有可达对象,并给它们打上标记。在这个过程中,即使对象之间存在循环引用,只要它们可以通过根对象到达,就会被标记为可达对象。

  • 清除阶段:在标记阶段完成后,垃圾回收器会遍历整个堆内存,清除那些没有被标记的对象(即不可达对象)。这些对象包括那些只被循环引用而没有被根对象引用的对象。清除这些对象后,它们占用的内存空间就会被回收。

五、总结

  • Python的垃圾回收机制以引用计数为主,同时辅以标记-清除和分代收集策略,以确保内存的有效管理和回收。
  • 引用计数简单直接,但存在执行效率问题和循环引用问题。
  • 标记-清除算法解决了循环引用问题,但增加了垃圾回收的复杂性。
  • 分代收集策略提高了垃圾回收的效率,减少了不必要的内存检查。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值