在我们开始讨论浅拷贝和深拷贝的区别之前,首先我们必须清楚什么是赋值?
在Python中,所谓的赋值实际上就是对象引用的传递而已,当创建一个对象的时候,再赋值给另外一个变量的时候,并不是赋值给另一个变量。而是把这个变量在地址空间的id地址值传递给另一个变量,简单的说就是拷贝了这个对象的引用。看图片,可能比较容易理解。
从图中,我们很容易的看到,a和b两个变量在地址空间中是一样。后来,我们又给a增加一个值89之后,a和b两个地址值还是一样。
浅拷贝
浅拷贝是对一个对象父级(外层)的拷贝,并不会拷贝子级(内部)。使用浅拷贝的时候,分为两种情况。
第一种,如果最外层的数据类型是可变的,比如说列表,字典等,浅拷贝会开启新的地址空间去存放。
第二种,如果最外层的数据类型是不可变的,比如元组,字符串等,浅拷贝对象的时候,还是引用对象的地址空间。
看图,我们就明白的看出,c的最外层是[a,b],可变数据类型,d在浅拷贝的时候,也直接把最外层拿过来。只拷贝最外层,而里面却没有拿到。
从图片看到,p(m,n)的最外层是元组不可变类型,当q在进行浅拷贝的时候,是直接引用p的地址,而不是再开辟新的地址空间存放。
深拷贝
深拷贝对一个对象是所有层次的拷贝(递归),内部和外部都会被拷贝过来。
深拷贝也分两种情况:
第一种,最外层数据类型可变。这个时候,内部和外部的都会拷贝过来。
第二种,外层数据类型不可变,如果里面是可变数据类型,会新开辟地址空间存放。如果内部数据类型不可变,才会如同浅拷贝一样,是对地址的引用。
楼上的图片是一种最简单的深拷贝,很容易看出,两个id值发生了改变,修改了一方,并不会影响另一方。
上面是有嵌套的拷贝。可以很明显的看出来,外层和内层的地址空间都发生了改变。
从图片看出,只要内部是可变数据类型,外部是可变的时候,深拷贝会开启新的地址空间存放。修改原本的变量,是不会影响深拷贝之后的。
深拷贝的作用:
- 减少内存的使用
- 以后在做数据的清洗、修改或者入库的时候,对原数据进行复制一份,以防数据修改之后,找不到原数据。