python深浅拷贝通俗讲解_Python的深浅拷贝讲解!

来源:Datawhale

本文约3100字,建议阅读6分钟

本文详细介绍了Python中的深浅拷贝的相关知识。

前言

在很多语言中都存在深浅拷贝两种拷贝数据的方式,Python中也不例外。本文中详细介绍了Python中的深浅拷贝的相关知识,文章的内容包含:

对象、数据类型、引用

赋值

浅拷贝

深拷贝

c4d9631cc8a5c367fc26c54a1954285d.png

一、Python对象

我们经常听到:在Python中一切皆对象。其实,说的就是我们在Python中构造的任何数据类型都是一个对象,不管是数字、字符串、字典等常见的数据结构,还是函数,甚至是我们导入的模块等,Python都会把它当做是一个对象来处理。

所有的Python对象都拥有3个属性:

身份

类型

我们看一个简单的例子来理解上面的3个属性:

假设我们声明了一个name变量,通过id、type方法能够查看对象的身份和类型:

0f7281c578a780344409b71956e0a112.png

甚至是type本身也是一个对象,它也拥有自己的身份、类型:

Python中,万物皆对象

二、数据类型

2.1 可变和不可变类型

在Python中,按照更新对象的方式,我们可以将对象分为2大类:可变数据类型和不可变数据类型。

不可变数据类型:数值、字符串、布尔值。不可变对象就是对象的身份和值都不可变。新创建的对象被关联到原来的变量名,旧对象被丢弃,垃圾回收器会在适当的时机回收这些对象。

可变数据类型:列表、字典、集合。所谓的可变指的是可变对象的值可变,但是身份是不可变的。

首先我们看看不可变对象:

3f93c75998c3ef352c8cf6bd369f973f.png

当我们定义了一个对象str1,给其赋值了“python”,便会在内存中找到一个固定的内存地址来存放;但是,当我们将“python”定义成另一个变量名的时候,我们发现:它在内存中的位置是不变的。

3595db138c5f8cc3629de87929bdd8b3.png

也就是说,这个变量在计算机内存中的位置是不变的,只是换了一个名字来存放,来看3个实际的例子:

9dbe07f947013072858ced725fedeba6.png

b3f25e24a96b191e91ceb5cf03b3edd8.png

fdc27d9c607fa13f9893f686a04979ea.png

以上的例子说明:当我们对字符串、数值型、布尔值的数据改变变量名,并不会影响到数据在内存中的位置。

我们看看可变类型的例子,列表、字典、集合都是一样的效果:

f2a7b21383c2b306ae5e83948e3d1f76.png

66204f4e6c5854881dcf8975b3ecc08d.png

f2d5a86d5b52750e8a2eaa76e1a57113.png

虽然是相同的数据,但是变量名字不同,内存中仍然会开辟新的内存地址来进行存放相同的数据,我们以字典为例:

921b9363e0ad92192c38a30c4f6af912.png

2.2 引用

在Python语言中,每个对象都会在内存中申请开辟一块新的空间来保存对象;对象在内存中所在位置的地址称之为引用。

可以说,我们定义的变量名实际上就是对象的地址引用。引用实际上就是内存中的一个数字地址编号。在使用对象的时候,只要知道这个对象的地址,我们就可以操作这个对象。

因为这个数字地址不太容易记忆,所以我们使用变量名的形式来代替对象的数字地址。在Python中,变量就是地址的一种表示形式,并不会开辟新的存储空间。

我们通过一个例子来说明变量和变量指向的引用(内存地址)实际上就是一个东西:

c06b179cb163b5b4162462b9c0959ba7.png

4ed3a0a43204d9ce5a40d017d35ec783.png

三、赋值

3.1 相同数据,不同变量名

讨论完Python的对象、属性和引用3个重要的概念之后,在正式介绍深浅拷贝之前,我们先讨论Python中的赋值。

在Python中,每次赋值都会开辟新的内存地址来存放数据,比如我们同时存放一个列表[1,2,3],即使数据是相同的,但是内存地址却不同:

5f9022f4965134dacb1ca137af78f874.png

其实就是两个不同的变量,只是恰好它们存放了相同的数据而已,但是存放的地址是不同的。

62af7315c2d578f35c44fdea6f9145f2.png

我们给v1列表追加了一个元素,发现它的内存地址是不变的,当然v2肯定是不变的:

86d0bf1ca0feccd5edf4e44d9f9db441.png

1d51e1587c89b0f3775bc4429966c9f3.png

3.2 一个变量多次赋值

如果我们对一个变量多次赋值,其内存是会变化的:

299eb7ceee4f72df68fa597e47dccb2e.png

7a53446f6d65bfe6417147194948009c.png

3.3 变量赋值

将一个变量赋值给另一个变量,其实它们就是同一个对象:数据相同,在内存中的地址也相同:

6e161344ec7aa8cf2e2b63517f164e0c.png

当我们给V1追加一个元素,V2也会同时变化:

336a786be901baea2de7066a0e0aa0c6.png

实际上它们就是同一个对象!!!!

3.4 嵌套赋值

如果是列表中嵌套着另外的列表,那么当改变其中一个列表的时候,另一个列表中的也会随着改变:

bc33e70e6b48934f7d36e68efcdf200a.png

原始数据信息:

9395f2deb3dfd7261f996258ccbf791f.png

当我们给v1追加了新元素之后:

7d5c88b14fec64dcc17c5be0947ae2cb.png

总结:赋值其实就是将一个对象的地址赋值给一个变量,使得变量指向该内存地址。

四、浅拷贝

在Python中进行拷贝之前,我们需要导入模块:

浅拷贝只是拷贝数据的第一层,不会拷贝子对象。

4.1 不可变类型的浅拷贝

如果只是针对不可变的数据类型(字符串、数值型、布尔值),浅拷贝的对象和原数据对象是相同的内存地址:

336667385030bbe13263507cca1f7877.png

3c774faf4a25777e22fa43df084fc35b.png

从上面的结果中我们可以看出来:针对不可变类型的浅拷贝,只是换了一个名字,对象在内存中的地址其实是不变的。

bfd0589a8adeb2b67cdd6fcf788204a4.png

4.2 可变类型的浅拷贝

首先我们讨论的是不存在嵌套类型的可变类型数据(列表、字典、集合):

5c9cc9118d63ea7b44c907554ce7b5e5.png

从上面的例子看出来:

列表本身的浅拷贝对象的地址和原对象的地址是不同的,因为列表是可变数据类型。

列表中的元素(第1个元素为例)和浅拷贝对象中的第一个元素的地址是相同的,因为元素本身是数值型,是不可变的。

通过一个图形来说明这个关系:

1c8ee28f8ec2aa46143e3717c8aca03a.png

字典中也存在相同的情况:字典本身的内存地址不同,但是里面的键、值的内存地址是相同的,因为键值都是不可变类型的数据。

d5bf154830004baa0dfc8fdabc73a264.png

如果可变类型的数据中存在嵌套的结构:

74532cdf6ce45846f83c3f1d16de7c7c.png

从上面的两个例子中我们可以看出来:

在可变类型的数据中,如果存在嵌套的结构类型,浅拷贝只复制最外层的数据,导致内存地址发生变化,里面数据的内存地址不会变。

五、深拷贝

深拷贝不同于浅拷贝的是:深拷贝会拷贝所有的可变数据类型,包含嵌套的数据中的可变数据。深拷贝是变量对应的值复制到新的内存地址中,而不是复制数据对应的内存地址。

5.1 不可变类型的深拷贝

关于不可变类型的深浅拷贝,其效果是相同的,具体看下面的例子:

6232f5433c1a76d19d34e08d7cb2d224.png

d944f0733bc8ec51bc67ad717d47e68e.png

0b529bf7f8049197ad9600c13d725687.png

我们得出一个结论:针对不可变数据类型的深浅拷贝,其结果是相同的。

5.2 可变类型的深拷贝

首先我们讨论的是不存在嵌套的情况:

针对列表数据:

d40593c05cbafd377d06633f5e8dd210.png

针对字典数据:

864b2a50e3663cc284ed08013c734870.png

我们可以得出结论:

深拷贝对最外层数据是只拷贝数据,会开辟新的内存地址来存放数据。

深拷贝对里面的不可变数据类型直接复制数据和地址,和可变类型的浅拷贝是相同的效果。

534ad81d3f961204e58dd2b02823d6e6.png

我们讨论存在嵌套类型的深拷贝(以列表为例)。

749c350e245ab16a54c39093ec8da5a5.png

结论1:对整个存在嵌套类型的数据进行深浅拷贝都会发生内存的变化,因为数据本身是可变的。

308d95febd9baba54468922fc087e84d.png

结论2:我们查看第一个元素1的内存地址,发生三者是相同的,因为1是属于数值型,是不可变类型。

d413af2ef1d761534045808e4bca6369.png

结论3:我们查看第三个元素即里面嵌套列表的内存,发现只有深拷贝是不同的,因为这个嵌套的列表是可变数据类型,深拷贝在拷贝了最外层之后还会继续拷贝子层级的可变类型。

7e23f33015d9f3f8c573f9dcfb8bb56b.png

结论4:我们查看嵌套列表中的元素的内存地址,发现它们是相同的,因为元素是数值型,是不可变的,不受拷贝的影响。

六、元组的深浅拷贝

元组本身是不可变数据类型,但是其中的值是可以改变的,内部可以有嵌套可变数据类型,比如列表等,会对它的拷贝结果造成影响。

6.1 不存在嵌套结构

当元组中不存在嵌套结构的时候,元组的深浅拷贝是相同的效果:

6b0d7a5783f507d2173ea61f2e4a657d.png

6.2 存在嵌套结构

当元组的数据中存在嵌套的可变类型,比如列表等,深拷贝会重新开辟地址,将元组重新成成一份。

994e32294341df060718b192b5db1181.png

七、is和==

在文章的开始就已经谈过:在Python中每个变量都有自己的标识、类型和值。每个对象一旦创建,它的标识就绝对不会变。一个对象的标识,我们可以理解成其在内存中的地址。is()运算符比较的是两个对象的标识;id()方法返回的就是对象标识的整数表示。

总结:is()比较对象的标识;==运算符比较两个对象的值(对象中保存的数据)。在实际的编程中,我们更多关注的是值,而不是标识本身。

第一个例子:我们创建了两个不同的对象,只是它们的值刚好相同而已。

7428f6b272871ad1e3c8b00f79255231.png

64506e2ed06e1454c1cc713daf86a11c.png

第二个例子:我们先创建了一个对象v3,然后将他赋值给另一个对象v4,其实它们就是相同的对象,所以标识(内存地址)是相同的,只是它们的名字不同而已。

de5a7f49668b356e01970987a1324dba.png

f2b838dac9193ecac47c683889fdd4b6.png

总结

通过大量的例子,我们得出结论:

在不可变数据类型中,深浅拷贝都不会开辟新的内存空间,用的都是同一个内存地址。

在存在嵌套可变类型的数据时,深浅拷贝都会开辟新的一块内存空间;同时,不可变类型的值还是指向原来的值的地址。

不同的是:在嵌套可变类型中,浅拷贝只会拷贝最外层的数据,而深拷贝会拷贝所有层级的可变类型数据。

编辑:王菁

校对:王欣

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值