什么是可变/不可变对象
不可变对象,该对象所指向的内存中的值不能被改变。当改变某个变量时候,由于其所指的值不能被改变,相当于把原来的值复制一份后再改变,这会开辟一个新的地址,变量再指向这个新的地址。
可变对象,该对象所指向的内存中的值可以被改变。变量(准确的说是引用)改变后,实际上是其所指的值直接发生改变,并没有发生复制行为,也没有开辟新的出地址,通俗点说就是原地改变。
Python中,数值类型(int和float)、字符串str、元组tuple都是不可变类型。而列表list、字典dict、集合set是可变类型。
还是看代码比较直观。先看不可变对象
不可变对象的例子
先说明一点is 就是判断两个对象的id是否相同, 而 == 判断的则是内容是否相同。
复制代码
a = 2
b = 2
c = a + 0
c += 0
print(id(a), id(b), id(2)) # id都相同
print(c is b) #True
复制代码
再来看字符串
astr = 'good'
bstr = 'good'
cstr = astr + ''
print(cstr is bstr) # True
print(id(astr), id(bstr), id('good')) # 三个id相同
和数值类型的结果一样。如果是下面这种情况,变量修改后不在是good
astr = 'good'
print(id(astr))
astr += 'aa'
print(id(astr)) # id和上面的不一样
由于是不可变对象,变量对应内存的值不允许被改变。当变量要改变时,实际上是把原来的值复制一份后再改变,开辟一个新的地址,astr再指向这个新的地址(所以前后astr的id不一样),原来astr对应的值因为不再有对象指向它,就会被垃圾回收。这对于int和float类型也是一样的。
再看tuple
add = (1, 2, 3)
aee = (1, 2, 3)
print(id(add), id(aee), id((1, 2, 3))) # id各不相同
aee = (1, 2, 3)
print(id(aee))
aee += () # 加空元组
print(id(aee)) # id变了!
print(aee) #(1 ,2,3)
虽然看上去都是(1 ,2, 3)按理说应该和上面一致才对。难道这是可变对象?再看
add = (1, 2, 3)
aee = add
print(id(aee), id(add)) # 这两个id一样
aee += (4, 5, 6)
print(id(aee)) # aee的id变了!
print(add) # add还是(1, 2, 3)没有变
又和数值类型于str类型一致了。如果是可变对象add = aee,它们指向同一地址(id相同)是肯定的。但不是同一对象的不同引用,因为如果是的话,aee的改变会引起add的改变,再tuple中并不是这样。所以tuple是不可变对象,但又和str和数值类型稍微有点区别。平常说的tuple不可变更多时候是指里面存放的值不能被改变(有些特殊情况,如tuple里面存放了list,可改变list里的元素。但实际上这个tuple并没有被改变)。
对于str、int、float只要在它们再类型相同的情况下,值也相同,那么它们的id相同。(为什么要说类型相同?)
a = 2.0
b = 2
print(a is b) # False, 一个int一个float,类型都不同
2和2.0就不在一个地址上。
可变对象的例子
lis = [1, 2, 3]
lis2 = [1, 2, 3]
虽然它们的内容一样,但是它们指向的是不同的内存地址
print(lis is lis2)
print(id(lis), id(lis2), id([1, 2, 3])) # 三个id都不同
再看赋值的情况下
alist = [1, 2, 3]
# alist实际上是对对象的引用,blist = alist即引用的传递,现在两个引用都指向了同一个对象(地址)
blist = alist
print(id(alist), id(blist)) # id一样
# 所以其中一个变化,会影响到另外一个
blist.append(4)
print(alist) # 改变blist, alist也变成了[1 ,2 ,3 4]
print(id(alist), id(blist)) # id一样,和上面值没有改变时候的id也一样
blist = alist这一句。alist实际上是对对象的引用,blist = alist即引用的传递,现在两个引用都指向了同一个对象(地址)。所以其中一个变化,会影响到另外一个。
再看看set
abb = {1, 2, 3}
acc = abb
print(id(abb), id(acc))
acc.add(4)
print(abb) # {1, 2, 3, 4}
print(id(abb), id(acc)) # 相等
和上面list的例子一致。
可变对象由于所指对象可以被修改,所以无需复制一份之后再改变,直接原地改变,所以不会开辟新的内存,改变前后id不变。
当然不可变对象就不是这样了, 可以和这个对比一下
abc = 3
dd = abc
dd = 43
print(abc) # 3,并不随dd的改变而改变
但是如果是拷贝,就仅仅是将内容拷贝过去,传递的并是不引用。这在想使用列表的值又不想修改原列表的时候特别有用。
blist = alist[:] # or alist.copy()
print(alist is blist) # False
blist.append(4)
print(alist) # 还是[1,2 ,3]没有变化
作为函数参数
作为函数参数,也是一样的,可变类型传递的是引用,不可变类型传递的是内容。
test_list = [1, 2, 3, 4]
test_str = 'HAHA'
def change(alist):
alist.append(5)
def not_change(astr):
astr.lower()
change(test_list)
not_change(test_str)
print(test_list) # 改变了原来的值
print(test_str) # 没有变
当然了,如果不想改变原来列表的值,参数可以传入列变的拷贝。alsit[:]
有趣的例子
再看一个有趣的例子,我们知道list是可以使用+添加一个列表的。
a1 = [1, 2, 3]
a2 = a1
print(id(a1), id(a2))
# 实际上是a2指向了新的对象,id已经改变。
# 所以现在a2、a1并不是同一对象的两个引用了,a2变化a1不会改变
a2 = a2 + [4] # 这个等式中,右边的a2还是和a1的id一样的,一旦赋值成功,a2就指向新的对象
print(id(1), id(a2)) # 不等,a2的id变化了
print(a1) # [1, 2, 3]没有变
如果是这样写
a1 = [1, 2, 3]
a2 = a1
print(id(a1), id(a2))
a2 += [4] # 相当于调用了a2.extend([4]),原地改变并没有新的对象产生
print(id(1), id(a2)) # 相等,a2的id没有变化
print(a1)
不同的地方在于a2 += [4],这句相当于调用了a2.extend([4])相当于原地改变,并没有新的对象产生。
1
python与C/C++不一样,它的变量使用有自己的特点,当初学python的时候,一定要记住“一切皆为对象,一切皆为对象的引用”这句话,其实这个特点类似于JAVA,所以在python里面大家也不用担心类似于C/C++中的指针的复杂问题。下面本文将对python里面的“可变数据类型”和“不可变数据类型”进行分析。
首先,我们需要知道在python中哪些是可变数据类型,哪些是不可变数据类型。可变数据类型:列表list和字典dict,set,自己定义的类对象,numpy中的ndarray对象,具体参考:NumPy:拷贝和视图。不可变数据类型:整型int、浮点型float、字符串型string和元组tuple,以及frozenset。(注意:字典的key只能是不可变对象,即字典的key只能是整型int、浮点型float、字符串型string和元组tuple)。
set(): 一种可变的、无序的、有限的集合,其元素是唯一的、不可变的(可哈希的)对象。
frozenset(): 一种不可变的、可哈希的、无序的集合,其元素是唯一的,不可变的哈希对象。
其次需要注意,python中的变量保存的都是值所在的地址,例如 a = 10,a保存的是10所在的地址。这里的可变与不可变指的是指向可变或者不可变。
然后,我们以int和list为例,来看看“可变数据类型”和“不可变数据类型”到底有什么区别。
不可变数据类型分析 。先来看一段程序:
>>> x = 1
>>> id(x)
31106520
>>> y = 1
>>> id(y)
31106520
>>> x == y
True
>>> x is y #具有相同值的不可变对象(例如整数)是同一对象
True
>>> x = 2
>>> id(x)
31106508
>>> y = 2
>>> id(y)
31106508
>>> z = x
>>> id(x)
31106508
>>> x += 2
>>> id(x) # 只要不可变对象指向的值发生变化,不可变对象就会重新指向新的值(即4)所在的地址
31106484
>>>x
4
>>>z #x都已经指向了新的值所在地址,所以肯定不会影响z的值
2