06.垃圾回收机制
1. 引入
解释器在执行到定义变量的语法时,会申请内存空间来存放变量的值,而内存的容量是有限的,这就涉及到变量值所占用内存空间的回收问题,当一个变量值没有用了(简称垃圾)就应该将其占用的内存给回收掉,那什么样的变量值是没有用的呢?
单从逻辑层面分析,我们定义变量将变量值存起来的目的是为了以后取出来使用,而取得变量值需要通过其绑定的直接引用(如x=10,10被x直接引用)或间接引用(如l=[x,1],x=10,10被x直接引用,而被容器类型l间接引用),所以当一个变量值不再绑定任何引用时,我们就无法再访问到该变量值了,该变量值自然就是没有用的,就应该被当成一个垃圾回收。
毫无疑问,内存空间的申请与回收都是非常耗费精力的事情,而且存在很大的危险性,稍有不慎就有可能引发内存溢出问题,好在Cpython解释器提供了自动的垃圾回收机制来帮我们解决了这件事。
2. 什么是垃圾回收机制?
垃圾回收机制(简称GC)是Python解释器自带一种机,专门用来回收不可用的变量值所占用的内存空间
3. 为什么要用垃圾回收机制
程序运行过程中会申请大量的内存空间,而对于一些无用的内存空间如果不及时清理的话会导致内存使用殆尽(内存溢出),导致程序崩溃,因此管理内存是一件重要且繁杂的事情,而python解释器自带的垃圾回收机制把程序员从繁杂的内存管理中解放出来。
4. 理解GC原理需要储备的知识
4.1. 堆区与栈区
在定义变量时,变量名与变量值都是需要储存的,分别对应内存中的两块区域:堆区与栈区
# 1、变量名与值内存地址的关联关系存放于栈区
# 2、变量值存放于堆区,内存管理回收的则是堆区的内容,
4.2. 直接引用与间接引用
直接引用指的是从栈区出发直接引用到的内存地址
间接应用指的是从栈区出发应用到堆区后,在通过进一步的引用才能到达的内存地址
如:
l2 = [20, 30] # 列表本身被变量名l2直接引用,包含的元素被列表间接引用
x = 10 # 值10被变量名x直接引用
l1 = [x, l2] # 列表本身被变量名l1直接引用,包含的元素被列表间接引用
5. 垃圾回收机制原理分析
python的GC模块主要运用了“引用计数”(reference counting)来跟踪和回收垃圾。在引用计数的基础上,还可以通过“标记-清楚”(mark and sweep)解决容器对象可能产生的循环引用的问题,并且通过“分代回收”(generation collection)以空间换取时间的方式来进一步提高垃圾回收的效率。
5.1. 引用计数
引用计数就是:变量值被变量名关联的次数
如:age=18
变量值18关联了一个变量名age,称之为引用计数为1
引用计数增加:
age=18(此时变量值18的引用计数为1)
m=age(把age的内存地址给了m,此时,m,age都关联了18,所以变量值18的引用计数为2)
引用计数减少:
age=10(名字age先于值18解除关联,再与10建立了关联,变量值18的引用计数为1)
del m(del的意思是解除变量名m)