1. 写在前面
这周在手写聚类算法的代码,在复制字典时遇到了浅拷贝和深拷贝的问题,这里总结记录一下。一般地,复制一个对象(在Python中,字典、列表都是常见的对象)有三种方法:赋值、浅拷贝和深拷贝,这三种复制方法具有不同的效果。
2. 赋值
赋值操作只是把原对象的地址赋给了新的对象。因此,对原对象的任意修改都会使新的对象变化,看下面的例子:
a = [1, 2, 3]
b = a # 赋值
a[0] = 2
print(a) # [2, 2, 3]
print(b) # [2, 2, 3]
3. 浅拷贝
浅拷贝会将原列表内的每个元素的地址都复制到新列表中,我们在调用list()、dict()等方法做复制时,都是浅拷贝。若元素为值,则修改元素不会使新列表发生变化,看下面的例子:
a = [1, 2, 3]
b = list(a) # 等效写法: b = a.copy()
a[0] = 2
print(a) # [2, 2, 3]
print(b) # [1, 2, 3]
但是,如果元素为对象(如列表),由于浅拷贝仅复制了对象的地址,因此修改/增加对象类的元素将会使新列表发生变化,看下面的例子:
a = [[1], 2, 3]
b = list(a)
a[0][0] = 2 # 修改元素: [1] -> [2]
a[0].append(3) # 添加元素: 3
print(a) # [[2, 3], 2, 3]
print(b) # [[2, 3], 2, 3]
值得注意的是,删除/替换对象类的元素不会使新列表发生变化,看下面的例子:
a = [[1], 2, [3, 4]]
b = list(a)
a[2] = [4, 5] # 替换元素: [3,4] -> [4,5]
a.pop(0) # 删除元素: [1]
print(a) # [2, [4, 5]]
print(b) # [[1], 2, [3, 4]]
要想彻底解释清楚这个现象,读者可以搜索基本类型(即值)和引用类型(即列表、字典等)的区别。通俗地说,修改/增加是对子列表内的元素进行操作,浅拷贝下原对象和拷贝对象的子列表各元素地址是一样的,因此会跟着一起变化;而删除/替换是对子列表本身进行操作,浅拷贝复制了子列表(头)的地址,原对象和拷贝对象的子列表在内存空间完全是两个东西,因此不会一起跟着一起变化。
4. 深拷贝
深拷贝是真正意义上的“复制”,它不仅拷贝了对象的地址,还拷贝了对象的子对象的地址,对原对象做任意修改,都不会影响现对象。看下面的例子:
import copy
a = [[1], 2, 3]
b = copy.deepcopy(a)
a[0][0] = 2 # 修改1: 修改值
a[0].append(3) # 修改2: 添加元素
print(a) # [[2, 3], 2, 3]
print(b) # [[1], 2, 3]
5. 总结
在对列表、字典等数据结构做复制操作时,要注意它们各元素的类型是基本类型(值)还是引用类型(字典、列表、元组等)。若均为值,则可以使用浅拷贝方法;若其中存在列表等引用类型且需要对其进行修改时,则应该使用深拷贝方法。