python——变量开辟内存相关问题_python开辟内存空间-CSDN博客

本文链接：https://blog.csdn.net/m0_61369227/article/details/138297846

a = 257
b = 257
print(a is b) # True

a = ‘123’
b = ‘123’
print(a is b) # True

a = (1, 2, 3)
b = (1, 2, 3)
print(a is b) # True

a = [1, 2]
b = [1, 2]
print(a is b) # False 可变数据类型，需要重新开辟空间


**所以我们平时写代码，在同一代码块下，只要是不可变数据类型的对象（数字，字符串，元祖）  
 被多个变量引用，不会重复开辟内存空间，可变数据类型的对象会开辟不同空间**


#### 字符串intern机制


刚有提到，在命令行除了小整数池，都会开辟不同的内存地址。  
 但你会发现，在命令行模式中，有的字符串并没有开辟不同的空间：

a = ‘123’
b = ‘123’
print(a is b)
True


这是由于字符串的intern机制，也就是说在命令行模式下，有个intern机制：如果当前变量引用的字符串对象已经存在的话，直接增加对应字符串对象的引用，而不去创建新的字符串对象。适用范围是：只包含[a-zA-Z0-9\_]，也就是说字符串只能包含字母数字下划线，如果有其他符号，就不使用intern机制。

a = ‘12 3’
b = ‘12 3’
print(a is b)
False


#### 列表内存开辟

定义一个列表

a = [10,20,30,40]

打印列表a的地址以及其元素

print(id(a)) # 4376650528
print(id(a[0])) # 10–4527943632
print(id(a[1])) # 20–4527943952
print(id(a[2])) # 30–4527944272
print(id(a[3])) # 40–4527944592


![在这里插入图片描述](https://img-blog.csdnimg.cn/39cdf1013cf9418db45c1f8505ce9a0c.png)

定义一个列表

a = [10,20,30,40]

使用a.append()

a.append(50)
print(a) # [10,20,30,40,50]
print(id(a)) #4376650528


![](https://img-blog.csdnimg.cn/img_convert/dda69410d6b79bfd3093134ee9c8a9a0.png)  
 列表是可变数据类型，地址不变，值可变。因此，添加新的值之后，地址也是不变的。


#### 函数的参数传递


实参：调用函数时，小括号中的参数，用来把数据传递到函数内部


形参：定义函数时，小括号中的参数，用来接收参数，在函数内部作为变量使用


**对于参数传递，函数中修改传参，到底影不影响外部变量，可以理解为 把实参 赋值 给了 形参 即： 形参 = 实参**


即：形参和实参指同一个地址，至于形参的改变会不会影响实参， 就根据内存开辟相关的知识判断就可以， 和函数本身没有关系


### 可变和不可变数据类型


不可变数据类型：数字，字符串，元祖


可变数据类型 ：列表，集合，字典


可变指：地址不变的情况下，可以改变其内部元素。


不可变指：地址不变的情况下，其值不可变。


### 浅拷贝和深拷贝


Python 深拷贝和浅拷贝概念理解  
 **- 浅拷贝**  
 拷贝的程度浅，**重新分配一块内存**，**创建一个新的对象**，但里面的元素是**原对象中各个子对象的引用**。


* 使用数据类型本身的构造器完成的也是浅拷贝，list2 = list(list1)
* 对于可变的序列，还可以通过切片操作符 : 来完成浅拷贝
* Python 还提供了对应的函数 copy.copy() 函数，适用于任何数据类型  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/34412bb0164346c4a9ce23fc9bb26bc9.png)


**b = a.copy():** 浅拷贝, a 和 b 是一个独立的对象，但他们的子对象还是指向统一对象（是引用）


**- 深拷贝**  
 拷贝的程度深，**重新分配一块内存**，创建一个新的对象，并且将原对象中的元素，以递归的方式，**通过创建新的子对象拷贝到新对象中**。因此，**新对象和原对象没有任何关联**


* Python 中以 copy.deepcopy() 来实现对象的深度拷贝


![在这里插入图片描述](https://img-blog.csdnimg.cn/8411dc22c29d4da982b6a0844b9a31fc.png)


**b = copy.deepcopy(a):** 深度拷贝, a 和 b 完全拷贝了父对象及其子对象，两者是完全独立的。


**-直接赋值**


其实就是对象的引用（别名）  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/f629199218f04c8eb2b25c65d896e954.png)


**b = a:** 赋值引用，a 和 b 都指向同一个对象。


**总结**


**使用浅拷贝：**  
 浅拷贝在拷贝时，只会copy第一层，如果第一层是可变类型，就在内存中开辟一个空间复制下来，如果第一层是不可变数据类型，就沿用之前的引用。更深的层次（里面层）并没有copy，沿用之前的引用。  
 所以对于列表来讲，列表浅拷贝之后的新列表 和 原列表 的修改是否会影响对方，主要看列表内部的索引位有没指向新的引用，如果有，那么就不会互相影响。否则就会。


* 内部索引位指向新的引用情况：直接对索引位进行重新赋值：a[0] = xxx，那么这个索引位肯定重新指向xxx
* 内部索引位不指向新的引用情况：元素就地修改(一些可变类型)，如元素是列表，这个列表内部元素进行自身的一些修改。


所以对于全是不可变数据类型元素的列表，浅拷贝得到的新列表 和 原列表 之间的修改 都不会影响对方  
 只有列表中包含了可变数据类型，且此可变数据类型进行了修改，没有改变此索引位的指向，才会影响对方。


**使用深拷贝:**  
 深拷贝时，会逐层进行拷贝，遇到可变类型，就开辟一块内存复制下来，遇到不可变类型就沿用之前的引用。  
 因为不可变数据修改会从新开辟新的空间，所以，深拷贝数据之间的修改都不会相互影响。


**直接赋值**  
 就是直接指向同一个对象，一切按照内存开辟来判断引用是否更换。


### 垃圾回收机制ＧＣ


Python的GC模块主要运用了“引用计数”（reference counting）来跟踪和回收垃圾。在引用计数的基础上，还可以通过“标记-清除”（mark and sweep）解决容器对象可能产生的循环引用的问题，并且通过“分代回收”（generation collection）以空间换取时间的方式来进一步提高垃圾回收的效率


#### 引用计数


引用计数就是：变量值被变量名关联的次数  
 如：age=18  
 变量值18被关联了一个变量名age，称之为引用计数为1  
 ![](https://img-blog.csdnimg.cn/img_convert/70e5152bf32badcc94c89a0974e7037e.png)  
 引用计数增加：  
 age=18 （此时，变量值18的引用计数为1）  
 m=age （把age的内存地址给了m，此时，m,age都关联了18，所以变量值18的引用计数为2）  
 ![](https://img-blog.csdnimg.cn/img_convert/ac9fd61d6a32977ce331b398f8cc5e65.png)  
 引用计数减少：  
 age=10（名字age先与值18解除关联，再与3建立了关联，变量值18的引用计数为1）  
 del m（del的意思是解除变量名x与变量值18的关联关系，此时，变量18的引用计数为0)


值18的引用计数一旦变为0，其占用的内存地址就应该被解释器的垃圾回收机制回收


#### 标记清除


引用计数机制存在着一个致命的弱点，即循环引用（也称交叉引用）

如下我们定义了两个列表，简称列表1与列表2，变量名l1指向列表1，变量名l2指向列表2

l1=[‘xxx’] # 列表1被引用一次，列表1的引用计数变为1
l2=[‘yyy’] # 列表2被引用一次，列表2的引用计数变为1
l1.append(l2) # 把列表2追加到l1中作为第二个元素，列表2的引用计数变为2
l2.append(l1) # 把列表1追加到l2中作为第二个元素，列表1的引用计数变为2

l1与l2之间有相互引用

l1 = ['xxx’的内存地址,列表2的内存地址]

l2 = ['yyy’的内存地址,列表1的内存地址]

l1
[‘xxx’, [‘yyy’, […]]]
l2
[‘yyy’, [‘xxx’, […]]]
l1[1][1][0]
‘xxx’


![在这里插入图片描述](https://img-blog.csdnimg.cn/2148d0ce724d41bdbb97c9cf011e54b8.png)


循环引用会导致：值不再被任何名字关联，但是值的引用计数并不会为0，应该被回收但不能被回收，什么意思呢？试想一下，请看如下操作

del l1 # 列表1的引用计数减1，列表1的引用计数变为1
del l2 # 列表2的引用计数减1，列表2的引用计数变为1


此时，只剩下列表1与列表2之间的相互引用  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/26a469c551b94213806607b586c0db72.png)


但此时两个列表的引用计数均不为0，但两个列表不再被任何其他对象关联，没有任何人可以再引用到它们，所以它俩占用内存空间应该被回收，但由于相互引用的存在，每一个对象的引用计数都不为0，因此这些对象所占用的内存永远不会被释放，所以循环引用是致命的，这与手动进行内存管理所产生的内存泄露毫无区别。


所以Python引入了“标记-清除” 与“分代回收”来分别解决引用计数的循环引用与效率低的问题


容器对象（比如：list，set，dict，class，instance）都可以包含对其他对象的引用，所以都可能产生循环引用。而“标记-清除”计数就是为了解决循环引用的问题。


标记/清除算法的做法是当应用程序可用的内存空间被耗尽的时，就会停止整个程序，然后进行两项工作，第一项则是标记，第二项则是清除

#1、标记
通俗地讲就是：
栈区相当于“根”，凡是从根出发可以访达（直接或间接引用）的，都称之为“有根之人”，
有根之人当活，无根之人当死。

具体地：标记的过程其实就是，遍历所有的GC Roots对象(栈区中的所有内容或者线程都可以作为GC Roots对象），
然后将所有GC Roots的对象可以直接或间接访问到的对象标记为存活的对象，其余的均为非存活对象，应该被清除。

#2、清除
清除的过程将遍历堆中所有的对象，将没有标记的对象全部清除掉。
学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！