Python内存管理机制

最新推荐文章于 2023-05-03 20:44:47 发布

XGF的碎碎念

最新推荐文章于 2023-05-03 20:44:47 发布

阅读量146

点赞数

分类专栏：找工作文章标签： python

本文链接：https://blog.csdn.net/weixin_39566101/article/details/127236776

版权

找工作专栏收录该内容

13 篇文章 0 订阅

订阅专栏

参考资源

知乎 https://zhuanlan.zhihu.com/p/164627977

Python内存池

Python引用内存池的原因:

当创建大量消耗小内存的对象时，频繁调用new/malloc会导致大量的内存碎片，致使效率降低。内存池的作用就是预先在内存中申请一定数量的，大小相等的内存块留作备用，当有新的内存需求时，就先从内存池中分配内存给这个需求，不够之后再申请新的内存。这样做最显著的优势就是能够减少内存碎片，提升效率。

在这里插入图片描述

python的对象管理主要位于Level+1~Level+3层

Level+3层：对于python内置的对象（比如int,dict等）都有独立的私有内存池，对象之间的内存池不共享，即int释放的内存，不会被分配给float使用
Level+2层：当申请的内存大小小于256KB时，内存分配主要由 Python 对象分配器（Python’s object allocator）实施
Level+1层：当申请的内存大小大于256KB时，由Python原生的内存分配器进行分配，本质上是调用C标准库中的malloc/realloc等函数

垃圾回收机制

Python的垃圾回收机制采用引用计数机制为主，标记清除-分代回收机制为辅的策略。其中，标记-清除机制用来解决引用带来的循环引用导致内存无法回收的问题，分代回收机制是为了提高垃圾回收的效率。

引用计数

Python通过引用计数来保存内存中的变量追踪，即记录该对象被其他使用的对象引用的次数。
Python中有个内部跟踪变量叫做引用计数器，每个变量有多少个引用，简称引用计数。当某个对象的引用计数为0时，就列入了垃圾回收队列。
引用计数增加的情况：

一个对象被分配给一个新的名字
将其放入一个容器中（如列表、元组或字典）
引用计数减少的情况：
使用del语句对对象别名显示的销毁
对象所在的容器被销毁或从容器中删除对象
引用超出作用域或重新赋值

标记-清除

在这里插入图片描述

标记-清除用来解决引用计数机制产生的循环引用，进而导致内存泄露的问题。循环引用只有在容器对象才会产生，比如字典，元组，列表等。
该机制在进行垃圾回收时分成两步，分别是：

标记阶段，遍历所有的对象，如果是可达的（reachable），也就是还有对象引用它，那么就标记该对象为可达。
清除阶段，再次遍历对象，如果发现某个对象没有标记为可达（即为Unreachable），则就将其回收

标记清除阶段，会暂停整个应用程序，等待标记清除结束后才会恢复应用程序的运行。为了减少应用程序暂停的时间，Python 通过“分代回收”(Generational Collection)以空间换时间的方法提高垃圾回收效率。

感觉这个解释的是比较清楚的 https://blog.csdn.net/u012864245/article/details/112937766

分代回收

分代回收是基于这样的一个统计事实，对于程序，存在一定比例的内存块的生存周期比较短；而剩下的内存块，生存周期会比较长，甚至会从程序开始一直持续到程序结束。生存期较短对象的比例通常在 80%～90%之间。因此，简单地认为：对象存在时间越长，越可能不是垃圾，应该越少去收集。这样在执行标记-清除算法时可以有效减小遍历的对象数，从而提高垃圾回收的速度，是一种以空间换时间的方法策略。

Python将所有的对象分为年轻代（第0代）、中年代（第1代）、老年代（第2代）三代。所有的新建对象默认是第0代对象。当在第0代的gc扫描中存活下来的对象将被移至第1代，在第1代的gc扫描中存活下来的对象将被移至第2代。

当某一代中被分配的对象与被释放的对象之差达到某一阈值时，就会触发当前一代的gc扫描。当某一代被扫描时，比它年轻的一代也会被扫描，因此，第2代的gc扫描发生时，第0，1代的gc扫描也会发生，即为全代扫描。