从python的列表推导式说起

引言

之前在刷leetcode时用到了数组中元素都是0的情况,看到两种方式生成这样的list:

  1. [0]*n
  2. [0 for _ in range(n)]

通过本地测试发现两种方式实现的效率并不一样,可偏偏这是一个二维dp问题,要生成一个二维数组,自然代码就要写成下面这样的形式了:

  1. [[0]*n]*m
  2. [[0 for _ in range(n)] for _ in range(m)]

结果提交时就发现正确的代码出现了错误,经过检查后发现这样的情况:

t=[{}]*5

type(t[0])
Out[73]: dict

t
Out[74]: [{}, {}, {}, {}, {}]

t[0][1] = 1

t
Out[76]: [{1: 1}, {1: 1}, {1: 1}, {1: 1}, {1: 1}]

print(id(t[0]))
2191850517384

print(id(t[1]))
2191850517384

问题出在了这,因为python中list是可变对象,如果用*的话就是把地址复制了一遍,指向的是一个list,而用for循环的话就是逐个的申请地址,所以每个list都不相同 。

可变对象与不可变对象

可变对象:在修改过程(例如对list append)中变量指向的地址不变,变的是内存中的数据
不可变对象:在修改(对int+1)时变量指向的地址发生改变。
所以多个list指向一个地址的话就是同一个list,相当于引用,给多个list起了别名。

参数传递与作用域

接下来再谈谈python中的参数传递,python规定所有的参数传递都是传递引用,也就是给数据的地址传递给函数,因此虽然有作用域之分,但是如果将list等可变对象(地址不变)传递给函数的话,在函数内部还是可以对外部的list进行修改的。

作用域与(不)可变对象:
python中的每个变量都是指向某个地址,作用域就是可以保证相同的变量名称可以指向不同的地址,int是一个不可变对象,所以a=0,那么a就是一个int型数据,如果执行a+=1的话a的地址就会发生改变,所以修改时变的是a的指向的地址,而对于list等可变对象,令l=[],如果执行l.append(1)的话,l的地址不变,修改的是l所指向的内存

所以,这就可以解释子程序中int和list的区别了,对int的修改只是对局部变量指向位置进行了修改,而对list修改则是对外部变量和局部变量指向的的内存空间的修改。

再回到之前的列表生成上,list存储的也不过是一些地址,*就是复制同样的地址,所以由于int是不可变的,以后修改的话改变的是地址与其他元素无关,但如果是list的话,修改的是同一块内存空间,所以其他的元素都会发生改变。

ps:
可变对象:list, dict, set.
不可变对象:int, string, float, tuple.
string不可变的好处:可以作为dict的键,多个相同的字符串变量可以共享一块内存。

变量如何发生变化

变量变化有三种情况,一种是把一个对象赋值给一个变量,这时会new这个对象,然后把这个实例传递给这个变量,第二种是把一个变量赋值给另一个变量,这时会把原来的变量的地址传递给这个变量。第三种是对本身进行修改,这分成两种情况对不可变对象的修改相当于新建一个对象,在赋值地址,对可变对象的修改就是在原内存空间上进行修改。

把不可变对象赋值给一个变量时有时需要新建一个实例有时不需要,例如 :

float需要新建float实例:
>>>a = 1.0
>>>b = 1.0
>>>id(a), id(b)
Out[193]: (1749796599392, 1749796599464)

int不需要新建相等的实例:
>>>a = 1
>>>b = 1
>>>id(a), id(b)
Out[196]: (1437467120, 1437467120)
但是把可变对象赋值给变量时总要新建实例,否则就会出现两个不同的变量修改同一内存地址的情况。这保证了我们一开始[[0 for _ in range(n)] for _ in range(m)]的正确性(里面的list每次都是一个不同的)。

所以,要注意函数的默认参数和类变量中的可变对象,因为在这些对象中也会存储可变对象的地址,所以在对这块地址指向的内存上做修改的话会出现累加的修改。

def mutable(b = []): #函数使用了缺省变量
    b.append(0)
    return b
>>>mutable()
[0]
>>>mutable()
[0,0]
>>>mutable()
[0,0,0]

list为什么不能作为dict的key

https://www.kawabangga.com/posts/1821
hash要基于内容而不是地址,而list地址是不变的,内容是可变的,所以就有了tuple作为替代,tuple就可以理解为内容相同变量就相同的数据类型。
hash要保证内容相同的hash之后地址相同,也要保证相同变量hash之后地址也相同,list不能同时满足这两个条件。

总结

想要真正理解这些知识就要真正理解python中变量是如何存在的(指向实例所在的内存地址),可变和不可变对象定义(修改时是修改地址还是修改内存),修改过程,参数传递(都是引用,即传递地址)等。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值