从python的列表推导式说起

最新推荐文章于 2024-09-02 23:14:47 发布

PKU_Jade

最新推荐文章于 2024-09-02 23:14:47 发布

阅读量488

点赞数 1

文章标签： python 引用可变对象

本文链接：https://blog.csdn.net/PKU_Jade/article/details/76652750

版权

算法专栏收录该内容

84 篇文章 1 订阅

订阅专栏

引言

之前在刷leetcode时用到了数组中元素都是0的情况，看到两种方式生成这样的list：

[0]*n
[0 for _ in range(n)]

通过本地测试发现两种方式实现的效率并不一样，可偏偏这是一个二维dp问题，要生成一个二维数组，自然代码就要写成下面这样的形式了：

[[0]*n]*m
[[0 for _ in range(n)] for _ in range(m)]

结果提交时就发现正确的代码出现了错误，经过检查后发现这样的情况：

t=[{}]*5

type(t[0])
Out[73]: dict

t
Out[74]: [{}, {}, {}, {}, {}]

t[0][1] = 1

t
Out[76]: [{1: 1}, {1: 1}, {1: 1}, {1: 1}, {1: 1}]

print(id(t[0]))
2191850517384

print(id(t[1]))
2191850517384

问题出在了这，因为python中list是可变对象，如果用*的话就是把地址复制了一遍，指向的是一个list，而用for循环的话就是逐个的申请地址，所以每个list都不相同。

可变对象与不可变对象

可变对象：在修改过程（例如对list append）中变量指向的地址不变，变的是内存中的数据
不可变对象：在修改（对int+1）时变量指向的地址发生改变。
所以多个list指向一个地址的话就是同一个list，相当于引用，给多个list起了别名。

参数传递与作用域

接下来再谈谈python中的参数传递，python规定所有的参数传递都是传递引用，也就是给数据的地址传递给函数，因此虽然有作用域之分，但是如果将list等可变对象（地址不变）传递给函数的话，在函数内部还是可以对外部的list进行修改的。

作用域与（不）可变对象：
python中的每个变量都是指向某个地址，作用域就是可以保证相同的变量名称可以指向不同的地址，int是一个不可变对象，所以a=0，那么a就是一个int型数据，如果执行a+=1的话a的地址就会发生改变，所以修改时变的是a的指向的地址，而对于list等可变对象，令l=[]，如果执行l.append(1)的话，l的地址不变，修改的是l所指向的内存。

所以，这就可以解释子程序中int和list的区别了，对int的修改只是对局部变量指向位置进行了修改，而对list修改则是对外部变量和局部变量指向的的内存空间的修改。

再回到之前的列表生成上，list存储的也不过是一些地址，*就是复制同样的地址，所以由于int是不可变的，以后修改的话改变的是地址与其他元素无关，但如果是list的话，修改的是同一块内存空间，所以其他的元素都会发生改变。

ps：
可变对象：list, dict, set.
不可变对象:int, string, float, tuple.
string不可变的好处：可以作为dict的键，多个相同的字符串变量可以共享一块内存。

变量如何发生变化

变量变化有三种情况，一种是把一个对象赋值给一个变量，这时会new这个对象，然后把这个实例传递给这个变量，第二种是把一个变量赋值给另一个变量，这时会把原来的变量的地址传递给这个变量。第三种是对本身进行修改，这分成两种情况对不可变对象的修改相当于新建一个对象，在赋值地址，对可变对象的修改就是在原内存空间上进行修改。

把不可变对象赋值给一个变量时有时需要新建一个实例有时不需要，例如：

float需要新建float实例:
>>>a = 1.0
>>>b = 1.0
>>>id(a), id(b)
Out[193]: (1749796599392, 1749796599464)

int不需要新建相等的实例:
>>>a = 1
>>>b = 1
>>>id(a), id(b)
Out[196]: (1437467120, 1437467120)
但是把可变对象赋值给变量时总要新建实例，否则就会出现两个不同的变量修改同一内存地址的情况。这保证了我们一开始[[0 for _ in range(n)] for _ in range(m)]的正确性（里面的list每次都是一个不同的）。

所以，要注意函数的默认参数和类变量中的可变对象，因为在这些对象中也会存储可变对象的地址，所以在对这块地址指向的内存上做修改的话会出现累加的修改。

def mutable(b = []): #函数使用了缺省变量
    b.append(0)
    return b
>>>mutable()
[0]
>>>mutable()
[0,0]
>>>mutable()
[0,0,0]

list为什么不能作为dict的key

https://www.kawabangga.com/posts/1821
hash要基于内容而不是地址，而list地址是不变的，内容是可变的，所以就有了tuple作为替代，tuple就可以理解为内容相同变量就相同的数据类型。
hash要保证内容相同的hash之后地址相同，也要保证相同变量hash之后地址也相同，list不能同时满足这两个条件。

总结

想要真正理解这些知识就要真正理解python中变量是如何存在的（指向实例所在的内存地址），可变和不可变对象定义（修改时是修改地址还是修改内存），修改过程，参数传递（都是引用，即传递地址）等。

PKU_Jade

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从python的列表推导式说起

引言之前在刷leetcode时用到了数组中元素都是0的情况，看到两种方式生成这样的list：[0]*n[0 for _ in range(n)]通过本地测试发现两种方式实现的效率并不一样，可偏偏这是一个二维dp问题，要生成一个二维数组，自然代码就要写成下面这样的形式了：[[0]*n]*m[[0 for _ in range(n)] for _ in range(m)]结果提交时就发现正确
复制链接

扫一扫

专栏目录