python——变量开辟内存相关问题_python开辟内存空间

a = 257
b = 257
print(a is b) # True

a = ‘123’
b = ‘123’
print(a is b) # True

a = (1, 2, 3)
b = (1, 2, 3)
print(a is b) # True

a = [1, 2]
b = [1, 2]
print(a is b) # False 可变数据类型,需要重新开辟空间


**所以我们平时写代码,在同一代码块下,只要是不可变数据类型的对象(数字,字符串,元祖)  
 被多个变量引用,不会重复开辟内存空间,可变数据类型的对象会开辟不同空间**


#### 字符串intern机制


刚有提到,在命令行除了小整数池,都会开辟不同的内存地址。  
 但你会发现,在命令行模式中,有的字符串并没有开辟不同的空间:



a = ‘123’
b = ‘123’
print(a is b)
True


这是由于字符串的intern机制,也就是说在命令行模式下,有个intern机制:如果当前变量引用的字符串对象已经存在的话,直接增加对应字符串对象的引用,而不去创建新的字符串对象。适用范围是:只包含[a-zA-Z0-9\_],也就是说字符串只能包含字母数字下划线,如果有其他符号,就不使用intern机制。



a = ‘12 3’
b = ‘12 3’
print(a is b)
False


#### 列表内存开辟



定义一个列表

a = [10,20,30,40]

打印列表a的地址以及其元素

print(id(a)) # 4376650528
print(id(a[0])) # 10–4527943632
print(id(a[1])) # 20–4527943952
print(id(a[2])) # 30–4527944272
print(id(a[3])) # 40–4527944592


![在这里插入图片描述](https://img-blog.csdnimg.cn/39cdf1013cf9418db45c1f8505ce9a0c.png)



定义一个列表

a = [10,20,30,40]

使用a.append()

a.append(50)
print(a) # [10,20,30,40,50]
print(id(a)) #4376650528


![](https://img-blog.csdnimg.cn/img_convert/dda69410d6b79bfd3093134ee9c8a9a0.png)  
 列表是可变数据类型,地址不变,值可变。因此,添加新的值之后,地址也是不变的。


#### 函数的参数传递


实参:调用函数时,小括号中的参数,用来把数据传递到函数内部


形参:定义函数时,小括号中的参数,用来接收参数,在函数内部作为变量使用


**对于参数传递,函数中修改传参,到底影不影响外部变量,可以理解为 把实参 赋值 给了 形参 即: 形参 = 实参**


即:形参和实参指同一个地址,至于形参的改变会不会影响实参, 就根据内存开辟相关的知识判断就可以, 和函数本身没有关系


### 可变和不可变数据类型


不可变数据类型:数字,字符串,元祖


可变数据类型 :列表,集合,字典


可变指:地址不变的情况下,可以改变其内部元素。


不可变指:地址不变的情况下,其值不可变。


### 浅拷贝和深拷贝


Python 深拷贝和浅拷贝概念理解  
 **- 浅拷贝**  
 拷贝的程度浅,**重新分配一块内存**,**创建一个新的对象**,但里面的元素是**原对象中各个子对象的引用**。


* 使用数据类型本身的构造器完成的也是浅拷贝,list2 = list(list1)
* 对于可变的序列,还可以通过切片操作符 : 来完成浅拷贝
* Python 还提供了对应的函数 copy.copy() 函数,适用于任何数据类型  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/34412bb0164346c4a9ce23fc9bb26bc9.png)


**b = a.copy():** 浅拷贝, a 和 b 是一个独立的对象,但他们的子对象还是指向统一对象(是引用)


**- 深拷贝**  
 拷贝的程度深,**重新分配一块内存**,创建一个新的对象,并且将原对象中的元素,以递归的方式,**通过创建新的子对象拷贝到新对象中**。因此,**新对象和原对象没有任何关联**


* Python 中以 copy.deepcopy() 来实现对象的深度拷贝


![在这里插入图片描述](https://img-blog.csdnimg.cn/8411dc22c29d4da982b6a0844b9a31fc.png)


**b = copy.deepcopy(a):** 深度拷贝, a 和 b 完全拷贝了父对象及其子对象,两者是完全独立的。


**-直接赋值**


其实就是对象的引用(别名)  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/f629199218f04c8eb2b25c65d896e954.png)


**b = a:** 赋值引用,a 和 b 都指向同一个对象。


**总结**


**使用浅拷贝:**  
 浅拷贝在拷贝时,只会copy第一层,如果第一层是可变类型,就在内存中开辟一个空间复制下来,如果第一层是不可变数据类型,就沿用之前的引用。更深的层次(里面层)并没有copy,沿用之前的引用。  
 所以对于列表来讲,列表浅拷贝之后的新列表 和 原列表 的修改是否会影响对方,主要看列表内部的索引位有没指向新的引用,如果有,那么就不会互相影响。否则就会。


* 内部索引位指向新的引用情况:直接对索引位进行重新赋值:a[0] = xxx,那么这个索引位肯定重新指向xxx
* 内部索引位不指向新的引用情况:元素就地修改(一些可变类型),如元素是列表,这个列表内部元素进行自身的一些修改。


所以对于全是不可变数据类型元素的列表,浅拷贝得到的新列表 和 原列表 之间的修改 都不会影响对方  
 只有列表中包含了可变数据类型,且此可变数据类型进行了修改,没有改变此索引位的指向,才会影响对方。


**使用深拷贝:**  
 深拷贝时,会逐层进行拷贝,遇到可变类型,就开辟一块内存复制下来,遇到不可变类型就沿用之前的引用。  
 因为不可变数据修改会从新开辟新的空间,所以,深拷贝数据之间的修改都不会相互影响。


**直接赋值**  
 就是直接指向同一个对象,一切按照内存开辟来判断引用是否更换。


### 垃圾回收机制GC


Python的GC模块主要运用了“引用计数”(reference counting)来跟踪和回收垃圾。在引用计数的基础上,还可以通过“标记-清除”(mark and sweep)解决容器对象可能产生的循环引用的问题,并且通过“分代回收”(generation collection)以空间换取时间的方式来进一步提高垃圾回收的效率


#### 引用计数


引用计数就是:变量值被变量名关联的次数  
 如:age=18  
 变量值18被关联了一个变量名age,称之为引用计数为1  
 ![](https://img-blog.csdnimg.cn/img_convert/70e5152bf32badcc94c89a0974e7037e.png)  
 引用计数增加:  
 age=18 (此时,变量值18的引用计数为1)  
 m=age (把age的内存地址给了m,此时,m,age都关联了18,所以变量值18的引用计数为2)  
 ![](https://img-blog.csdnimg.cn/img_convert/ac9fd61d6a32977ce331b398f8cc5e65.png)  
 引用计数减少:  
 age=10(名字age先与值18解除关联,再与3建立了关联,变量值18的引用计数为1)  
 del m(del的意思是解除变量名x与变量值18的关联关系,此时,变量18的引用计数为0)


值18的引用计数一旦变为0,其占用的内存地址就应该被解释器的垃圾回收机制回收


#### 标记清除


引用计数机制存在着一个致命的弱点,即循环引用(也称交叉引用)



如下我们定义了两个列表,简称列表1与列表2,变量名l1指向列表1,变量名l2指向列表2

l1=[‘xxx’] # 列表1被引用一次,列表1的引用计数变为1
l2=[‘yyy’] # 列表2被引用一次,列表2的引用计数变为1
l1.append(l2) # 把列表2追加到l1中作为第二个元素,列表2的引用计数变为2
l2.append(l1) # 把列表1追加到l2中作为第二个元素,列表1的引用计数变为2

l1与l2之间有相互引用

l1 = ['xxx’的内存地址,列表2的内存地址]

l2 = ['yyy’的内存地址,列表1的内存地址]

l1
[‘xxx’, [‘yyy’, […]]]
l2
[‘yyy’, [‘xxx’, […]]]
l1[1][1][0]
‘xxx’


![在这里插入图片描述](https://img-blog.csdnimg.cn/2148d0ce724d41bdbb97c9cf011e54b8.png)


循环引用会导致:值不再被任何名字关联,但是值的引用计数并不会为0,应该被回收但不能被回收,什么意思呢?试想一下,请看如下操作



del l1 # 列表1的引用计数减1,列表1的引用计数变为1
del l2 # 列表2的引用计数减1,列表2的引用计数变为1


此时,只剩下列表1与列表2之间的相互引用  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/26a469c551b94213806607b586c0db72.png)


但此时两个列表的引用计数均不为0,但两个列表不再被任何其他对象关联,没有任何人可以再引用到它们,所以它俩占用内存空间应该被回收,但由于相互引用的存在,每一个对象的引用计数都不为0,因此这些对象所占用的内存永远不会被释放,所以循环引用是致命的,这与手动进行内存管理所产生的内存泄露毫无区别。


所以Python引入了“标记-清除” 与“分代回收”来分别解决引用计数的循环引用与效率低的问题


容器对象(比如:list,set,dict,class,instance)都可以包含对其他对象的引用,所以都可能产生循环引用。而“标记-清除”计数就是为了解决循环引用的问题。


标记/清除算法的做法是当应用程序可用的内存空间被耗尽的时,就会停止整个程序,然后进行两项工作,第一项则是标记,第二项则是清除



#1、标记
通俗地讲就是:
栈区相当于“根”,凡是从根出发可以访达(直接或间接引用)的,都称之为“有根之人”,
有根之人当活,无根之人当死。

具体地:标记的过程其实就是,遍历所有的GC Roots对象(栈区中的所有内容或者线程都可以作为GC Roots对象),
然后将所有GC Roots的对象可以直接或间接访问到的对象标记为存活的对象,其余的均为非存活对象,应该被清除。

#2、清除
清除的过程将遍历堆中所有的对象,将没有标记的对象全部清除掉。
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、全套PDF电子书

书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。

四、入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

五、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

六、面试资料

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里无偿获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值