在面试过程中,经常被问到这样一个问题:
什么是浅复制,什么是深复制,又什么区别?
如果没听过这个概念的人肯定会郁闷,“纳尼,复制还有深复制浅复制?”
那么什么是深复制,而什么又是浅复制?
这主要是针对字典和列表这类可变的数据类型来说的。一般来说,我们要想变量 x 和变量 y 的值一样的话,直接赋值就可以了 x = y
。
如果是不可变类型是没问题的,比如下面的例子:
>>> y = 10
>>> x = y # 将 y 的值赋给 x,也就是 x 和 y 指向同一个内存地址
>>> x
10
>>> y
10
>>> y = 0 # 改变 y 的值
>>> x # x 的值不会变化
10
这是因为 y 的值变化了,意味着 y 指向了新的内存地址,而 x 还是原来的地址,所以并不会受影响。
但是列表这种可变类型就不一样了:
>>> la = [3, 5, 7, 9]
>>> lb = la # la 的值赋给 lb,lb 和 la 指向了同一个内存地址
>>> la[1] = 55 # 通过索引修改 la 的元素值
>>> la
[3, 55, 7, 9]
>>> lb # lb 也跟着发生了变化
[3, 55, 7, 9]
这是因为列表变量指向的是列表所在的内存地址,lb 和 la 都是指向同一个列表的地址,因此这个列表中的内容变化,通过这两个变量查到都会变化,毕竟这两个变量指向的是同一个内容。
那么要想 lb 和 la 独立开,怎么办呢?那么就需要用到列表中提供的浅复制功能了:
>>> la = [3, 5, 7, 9]
>>> lb = la.copy() # 把 la 的内容拷贝一份出来,存入 lb 指向的新地址
>>> la
[3, 5, 7, 9]
>>> lb
[3, 5, 7, 9]
>>> la[1] = 77 # 修改 la
>>> la
[3, 77, 7, 9]
>>> lb # 不会影响 lb
[3, 5, 7, 9]
从上面可以看出,la 和 lb 通过列表复制的方式成为两个互不影响的独立变量了。那为什么说这是浅复制呢?看下面的例子:
>>> la = [3, 5, 7,['x', 'y']] # 二维列表
>>> lb = la.copy()
>>> la
[3, 5, 7, ['x', 'y']]
>>> lb
[3, 5, 7, ['x', 'y']]
>>> la[1] = 55
>>> la
[3, 55, 7, ['x', 'y']]
>>> lb # 修改普通元素是不会影响的
[3, 5, 7, ['x', 'y']]
>>> la[3][1] = 'abc'
>>> la
[3, 55, 7, ['x', 'abc']]
>>> lb # 但是如果修改的子列表,也会互相影响
[3, 5, 7, ['x', 'abc']]
从上面可以看出,虽然使用了列表的 copy 方法,但是一旦涉及到列表中的元素是列表这种多维列表的方式,依然会互相影响。
那么要实现完全独立,不管是多少维度的列表都能完全独立的话,需要用到 Python 标准库中的 copy 库提供的 deepcopy 函数了:
>>> import copy # 引入 copy 库
>>> la = [3, 5, 7,['x', 'y']]
>>> lb = copy.deepcopy(la) # 调用 copy 库中的 deepcopy 函数
>>> la
[3, 5, 7, ['x', 'y']]
>>> lb
[3, 5, 7, ['x', 'y']]
>>> la[3][1] = 'abc'
>>> la
[3, 5, 7, ['x', 'abc']]
>>> lb # 这下怎么折腾都不会影响到 lb 了
[3, 5, 7, ['x', 'y']]
用了 deepcopy 函数,那么不管其中有多少层的子列表,都不会互相影响了。