Python内存管理机制
- Python的内存管理机制:引用计数、垃圾回收、内存池机制
引用计数
变量与对象
变量和对象概述
- 变量 ,通过变量指针引用对象,变量指针指向的是对象的地址,然后再取值
- 对象 ,类型已知,每个对象都包含一个头部信息(类型表示符和引用计数器)
- 注意 :变量名是没有类型的,类型是属于对象的,因为变量引用对象,所以类型随对象
变量的引用判断 is
- 通过is来判断变量的引用所指的对象是否相同
大整数
>>> a = 10000
>>> b = 10000
>>> a is b
False
小整数
>>> a = 100
>>> b = 100
>>> a is b
True
长字符串
>>> a = 'hello world'
>>> b = 'hello world'
>>> a is b
False
短字符串
>>> a = 'abcdef_123456'
>>> b = 'abcdef_123456'
>>> a is b
True
列表
>>> a = []
>>> b = []
>>> a is b
False
- 通过观察上面的例子:
- Python缓存了小整数(-5~256)和短字符串(只由字母、下划线或数字组成的字符串),因此每个对象在内存中只存有一份,引用所指对象就是相同的,即使使用赋值语句,也只是创造新的引用,而不是对象本身
- Python没有缓存长字符串、列表及其他对象,可以由多个相同的对象,可以使用赋值语句创建出新的对象
引用计数
-
在Python中,每个对象都有存有指向该对象的引用总数,即引用计数(reference count)
-
查看对象的引用总数的函数
sys.getrefcount()
- 注意:当使用
getrefcount()
函数查看对象的引用总数时,实际上为该对象创建了一个临时引用,所以getrefcount()
所得的结果比预期结果多 1
- 注意:当使用
-
引用计数增加
- 1、对象被创建
n = 1
,1
这个对象的引用计数就会加1 - 2、变量引用对象,该变量又被其他变量引用
m = n
,1
这个对象的引用计数再加1 - 3、作为容器对象的元素
a = [1,2,3]
- 4、被作为参数传递给函数
foo(1)
- 1、对象被创建
-
引用计数减少
- 1、对象的别名被显示的销毁
del n
,1
这个对象的引用计数就会减1 - 2、对象的一个别名赋值给其他对象
n = 2
,1
这个对象的引用计数就会减1 - 3、对象从一个容器对象中移除,或,容器对象本身被销毁
a.remove(1)
- 4、一个本地引用离开它的作用域,比如上面的foo(1)函数结束,
1
这个对象引用减1
- 1、对象的别名被显示的销毁
普通引用
>>> import sys
>>> a = [1,2,3]
>>> sys.getrefcount(a)
2
>>> b = a
>>> sys.getrefcount(a)
3
>>> sys.getrefcount(b)
3
对象引用对象
- Python的一个容器对象(container),比如表、词典等,可以包含多个对象。实际上,容器对象中包含的并不是元素对象本身,是指向各个元素对象的引用
>>> a = [1,2,3]
>>> sys.getrefcount(a)
2
>>> b = [a,a]
>>> sys.getrefcount(a)
4
- a 是一个列表对象,b也是一个列表对象,并在列表中引用了两次a对象,所以的a的引用计数增加了2
引用环
- 当对象与对象之间互相引用或自己引用自己时,会构成引用环
>>> a = []
>>> b = [a]
>>> a.append(b)
>>> sys.getrefcount(a)
3
>>> sys.getrefcount(b)
3
- 引用环的存在会给上面的垃圾回收机制带来很大的困难。这些引用环可能构成无法使用,但引用计数不为0的一些对象。
- 为了回收这样的引用环,Python复制每个对象的引用计数,可以记为
gc_ref
。假设,每个对象i
,该计数为gc_ref_i
。Python会遍历所有的对象i
。对于每个对象i
引用的对象j
,将相应的gc_ref_j
减 1。在结束遍历后,gc_ref
不为 0 的对象,和这些对象引用的对象,以及继续更下游引用的对象,需要被保留。而其它的对象则被垃圾回收。
垃圾回收
- 当Python中的对象越来越多,占据越来越大的内存,启动垃圾回收(garbage collection),将没用的对象清除。
原理
-
当Python的某个对象的引用计数降为0时,说明没有任何引用指向该对象,该对象就成为要被回收的垃圾。比如某个新建对象,被分配给某个引用,对象的引用计数变为1。如果引用被删除,对象的引用计数为0,那么该对象就可以被垃圾回收。
-
注意:
- 1、垃圾回收时,Python不能进行其它的任务,频繁的垃圾回收将大大降低Python的工作效率;
- 2、Python只会在特定条件下,自动启动垃圾回收(垃圾对象少就没必要回收)
- 3、当Python运行时,会记录其中分配对象(object allocation)和取消分配对象(object deallocation)的次数。当两者的差值高于某个阈值时,垃圾回收才会启动。
阈值分析
- gc模块查看阈值
>>> import gc
>>> gc.get_threshold()
(700, 10, 10)
- 700 即是垃圾回收启动的阈值
- 每 10 次0代垃圾回收,会配合1次1代垃圾回收,而每 10 次1代垃圾回收,会配合1次2代垃圾回收
- 可以手动启动垃圾回收
gc.collect()
分代回收
- 上面说的0代、1代、2代就是Python垃圾回收机制中的分代回收
- Python将所有对象分为0,1,2三代
- 所有新建的对象都是0代
- 当某一代对象经历过垃圾回收,依然存活,就会被归为下一代对象
内存池机制
- ython又分为大内存和小内存。大小以256字节为界限,对于大内存使用Malloc进行分配,而对于小内存则使用内存池进行分配。
- Python的内存池又分为4个层次:Block、Pool、Arean、usedpool
- 其中block是最小的内存单元,大小为8的整数倍。如果想申请27B的内存,会分配一个32B的block