项目场景:
类中保存了一段二进制数据,为了使用方便,希望提供两种访问方式:1. 通过类成员名直接访问;2. 通过字典访问。并且为了节省空间,两种方式访问到的数据需要指向同一个对象,数据还可能会改变。
问题描述:
在改变字典a.data_dic['bin']所指向的数据之后,a.data还是空的没有任何改变
class A:
def __init__(self):
self.data = b''
self.data_dic = {'bin': self.data}
a = A()
a.data_dic['bin'] += bytes(512)
print(id(a.data), id(a.data_dic['bin']))
原因分析:
因为a.data初始化为b'',属于bytes类型。而bytes是不可变的,所以在拼接b''和bytes(512)的时候,创建了一个新的对象。所以字典指向了新的对象,a.data指向了旧的对象。
解决方案:
用可变的bytearray代替bytes就好啦。
class A:
def __init__(self):
self.data = bytearray(0)
self.data_dic = {'bin': self.data}
a = A()
a.data_dic['bin'] += bytearray(512)
print(id(a.data), id(a.data_dic['bin']))
拓展:append 和 a += b 和 a = a + b
对于不可变对象,任何形式的内容改变都会创建新的对象。而对于可变对象,某些情况下也会创建新的对象。
1. append
对可变对象来说,append是在原对象上新增元素。所以不会创建新对象。
2. a += b
与C语言不同的是,python的a+=b并不是简单的a=a+b的缩写,它还有与append类似的,在原有对象上新增的含义。这个写法也不会创建新对象。
3. a = a + b
在python中,创建新对象与赋值都是运算符=完成的,所以即便a是可变对象,这个写法也会创建新的对象。等同于新a = 旧a + b,如果旧a没有人引用,那么就会被销毁。
>>>b = bytearray(512)
>>>print(id(b))
78506752
>>>b.append(0x12)
>>>print(id(b))
78506752
>>>b += bytearray(511)
>>>print(id(b))
78506752
>>>b = b + bytearray(512)
>>>print(id(b))
78483648