Python内存管理机制

实验中遇到了Python内存泄漏的问题,网上找了一些资源对Python 的内存管理机制和内存优化进行了学习,先把内存管理机制进行了总结,内容很多是参考和复制参考文献中的内容。

1、变量与对象关系

在Python中,变量不同于C语言中的变量机制,对C语言来说,我们创建一个变量A时就会为为该变量申请一个内存空间,并将变量值 放入该空间中,当将该变量赋给另一变量B时会为B也申请一个新的内存空间,并将变量值放入到B的内存空间中,所以A和B的指针不一致,下图:

但是在Python中,变量是附在对象上的标签。当变量被绑定在一个对象上的时候,该变量的引用计数就是1。

在Python中变量通过变量指针引用对象,变量指针指向具体对象的内存空间,取对象的值。而对象,类型已知,每个对象都包含一个头部信息(头部信息:类型标识符和引用计数器)。变量单独来说只是一个符号或标签,没有太多的意义,当它绑定到对象上时,才会有具体作用,变量引用什么类型的对象,变量就是什么类型的。

一些需要注意的细节 

  • 当一个变量“引用”另一个变量时,两个变量所指的对象是一个地址和数值。
>>> var1 = 123
>>> var2 = var1
>>> id(var1)
1749839904
>>> id(var2)
1749839904
  • 当一个变量var4“引用”另一个变量var3,var3赋予新的对象时,var3的id改变,var4任然不变。并且对比上图代码,我们可以知道对于某些类型对象,其在Python中的地址是不变的,比如123,数值型变量引用时其id地址就是1749839904,有兴趣的可以试试将123当做列表等类型,查看其Id有什么变化。
>>> var3 = 123
>>> var4 = var3
>>> id(var3)
1749839904
>>> id(var4)
1749839904

>>> var3 = 456
>>> id(var3)
48910864

>>> id(var4)
1749839904
  •  通过is进行引用所指判断,is是用来判断两个引用所指的对象是否相同。
  • Python缓存了整数和短字符串,每个对象在内存中只存有一份,引用所指对象就是相同的,即使使用赋值语句,也只是创造新的引用,而不是对象本身;
  • Python没有缓存长字符串、列表及其他对象,可以由多个相同的对象,可以使用赋值语句创建出新的对象。
>>> var5 = 1
>>> var6 = 2
>>> print(var5 is var6)
True
>>> a = "hello"
>>> b = "hello"
>>> print(a is b)
True
>>> var7 = "hello world"
>>> var8 = "hello world"
>>> print(var7 is var8)
False
>>> var9 = []
>>> var10 =[]
>>> print(var9 is var10)
False
>>> c=256
>>> d=256
>>> print(c is d)
True
>>> e=257
>>> f=257
>>> print(e is f)
False

2、引用计数

Python采用了类似Windows内核对象一样的方式来对内存进行管理。每个对象都有指向该对象的引用总数——引用计数。我们使用sys.getrefcount()查看对象的引用计数。

  • 普通引用
>>> import sys
>>> a  = [1,2,3]
>>> sys.getrefcount(a)
2
>>> b = a
>>> sys.getrefcount(a)
3
>>> sys.getrefcount(b)
3

 当使用某个引用作为参数,传递给sys.getrefcount()时,参数实际上创建了一个临时的引用。因此,sys.getrefcount()得到的结果,会多1。

  • 容器对象

Python的一个容器对象(比如:表、词典等),可以包含多个对象。

>>> a = [1,2,3,4]
>>> b = a
>>> print(a is b)
True
>>> a[0] = 5
>>> a
[5, 2, 3, 4]
>>> print(a is b)
True
>>> b
[5, 2, 3, 4]

 在Python中,容器对象中包含的并不是元素对象本身,而是指向各个元素对象的引用。

下面一些情况下引用计数增加:

1.对象被创建:x=4

2.另外的别人被创建:y=x

3.被作为参数传递给函数:foo(x)

4.作为容器对象的一个元素:a=[1,x,'33']

引用计数减少:

1.一个本地引用离开了它的作用域。比如上面的foo(x)函数结束时,x指向的对象引用减1。

2.对象的别名被显式的销毁:del x ;或者del y

3.对象的一个别名被赋值给其他对象:x=789

4.对象从一个窗口对象中移除:myList.remove(x)

5.窗口对象本身被销毁:del myList,或者窗口对象本身离开了作用域。

3、垃圾回收

Python不同于C等语言,可以不用事先声明变量类型而直接对变量进行赋值。对Python来说,对象的类型和内存都是在运行时确定的,所以说Python是动态语言。

当Python中的对象越来越多,占据越来越大的内存,就会启动垃圾回收,将没用的对象清除。当Python的某个对象的引用计数降为0时,说明没有任何引用指向该对象,该对象就成为要被回收的垃圾。比如某个新建对象,被分配给某个引用,对象的引用计数变为1。如果引用被删除,对象的引用计数为0,那么该对象就可以被垃圾回收。

当内存中有不再使用的部分时,垃圾收集器就会把他们清理掉。它会去检查那些引用计数为0的对象,然后清除其在内存的空间。当然除了引用计数为0的会被清除,还有一种情况也会被垃圾收集器清掉:当两个对象相互引用时,他们本身其他的引用已经为0。

  • 使用del
>>> var10 = [1234]
>>> del var10
>>> id(var10)
Traceback (most recent call last):
  File "<pyshell#47>", line 1, in <module>
    id(var10)
NameError: name 'var10' is not defined

del var10,已经没有任何引用指向[1234],该表引用计数变为0,Python扫描到这个引用计数为0的对象,就将它所占据的内存清空。 所以使用id函数时,会报错说var10没有被定义。

一些注意

1、垃圾回收时,Python不能进行其它的任务,频繁的垃圾回收将大大降低Python的工作效率;

2、Python只会在特定条件下,自动启动垃圾回收(垃圾对象少就没必要回收)

3、当Python运行时,会记录其中分配对象(object allocation)和取消分配对象(object deallocation)的次数。当两者的差值高于某个阈值时,垃圾回收才会启动。

gc模块中查看阈值的方法:

>>> import gc
>>> gc.get_threshold()
(700, 10, 10)

700是垃圾回收启动的阈值。每10次0代垃圾回收,会配合1次1代的垃圾回收;而每10次1代的垃圾回收,才会有1次的2代垃圾回收;对于Pyhon中分代的理解:Python将所有的对象分为0,1,2三代;所有的新建对象都是0代对象;当某一代对象经历过垃圾回收,依然存活,就被归入下一代对象。

也可以手动启动垃圾回收,直接调用gc.collect()函数。

>>> gc.collect()
6

4、内存池机制

Python中有分为大内存和小内存(256K界限):

  • 大内存使用malloc进行分配
  • 小内存使用内存池进行分配
  • Python的内存池(金字塔)

Python的内存机制以金字塔行:

-1,-2层主要有操作系统进行操作。

第0层是C中的malloc,free等内存分配和释放函数进行操作。

第1层和第2层是内存池,有Python的接口函数PyMem_Malloc函数实现,当对象小于256K时有该层直接分配内存。

第3层是最上层,也就是我们对Python对象的直接操作。

在 C 中如果频繁的调用 malloc 与 free 时,是会产生性能问题的,再加上频繁的分配与释放小块的内存会产生内存碎片。Python 在这里主要干的工作有:

如果请求分配的内存在1~256字节之间就使用自己的内存管理系统,否则直接使用 malloc。

这里还是会调用 malloc 分配内存,但每次会分配一块大小为256k的大块内存。

对于简单的Python对象,例如数值、字符串,元组(tuple不允许被更改)采用的是复制的方式(深拷贝),即是当将另一个变量B赋值给变量A时,虽然A和B的内存空间仍然相同,但当A的值发生变化时,会重新给A分配空间,A和B的地址变得不再相同。而对于像字典(dict),列表(List)等,改变一个就会引起另一个的改变,也称之为浅拷贝。

参考资料

[1]https://www.cnblogs.com/geaozhang/p/7111961.html

[2]https://www.cnblogs.com/aomi/p/7353411.html

[3]https://blog.csdn.net/github_38976972/article/details/79633214?utm_source=blogxgwz5

[4]https://blog.csdn.net/github_38976972/article/details/79633214?utm_source=blogxgwz5

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值