最近在温习遗传算法,将Mat Buckland的游戏开发中的人工智能技术中的C++代码重新用python来实现,在实现TSP(旅行商问题)的时候,着实被python的对象复制坑了一次,在选择最优种群个体的时候,需要先将本次进化中最优的个体复制两次到下一次进化中,正是这两次复制同一个个体,导致最后进化总是快速的出现错误。
#问题
定义一个class如下:
class Test(object):
def __init__(self, nc):
self.num = nc
return
新建一个Test对象,再新建一个list,将创建的Test对象连续两次添加到list中:
a = Test(5)
c = []
c.append(a)
c.append(a)
print c[0].num, c[1].num
此时的输出为:
5 5
修改第一个添加的对象的值,第二次添加的对象值也会随之改变:
c[0].num = 10
print c[0].num, c[1].num
此时的输出为:
10 10
#分析
刚开始的时候并未想到是python的对象的复制方式导致出现问题,倒腾了许久之后发现每次出现问题的位置都是种群的前两个个体,这两个个体总是在操作之后同时改变,而前两个个体正是连续复制的同一个个体对象,对着这两行代码发了半天呆,才想起来python的对象的拷贝方式的差异。
#Python的copy
python的赋值是按照引用来传递的,赋值后如果修改了被引用对象,那么赋值的对象也会随之改变,因为他们实际就是同一个对象:
>>> a = [1,2,3,4]
>>> b = a
>>> id(a)
44036296L
>>> id(b)
44036296L
>>> a.append(5)
>>> b
[1, 2, 3, 4, 5]
>>> b.append(6)
>>> a
[1, 2, 3, 4, 5, 6]
而如何摆脱这种赋值中的引用关系,就需要用到copy模块中的copy和deepcopy。
#浅拷贝
copy.copy是浅拷贝,只会拷贝父对象,不会拷贝父对象中的子对象,示例如下:
>>> import copy
>>> a=[1,[1,2]]
>>> b=copy.copy(a) #此时b是a的一个浅拷贝
>>> b
[1, [1, 2]]
>>> a.append(3) #改变父对象a
>>> b
[1, [1, 2]] #因为b是a的拷贝,不再是引用,所以改变父对象a,不对改变拷贝对象b
>>> a[1].append(3) #改变父对象a的子对象a[1]
>>> b
[1, [1, 2, 3]] #浅拷贝不会拷贝子对象,所以改变了a[1], b[1]依然会改变
如果用C/C++语言来解释的话,就是父对象已经是一个新的malloc(new)的地址,而子对象仍然使用的是同一个指针地址。图懒得画了,各位自行想象吧......>_<
#深拷贝
copy.deepcopy是深拷贝,父对象子对象都会被拷贝,也就是跟原对象再无关系,示例如下:
>>> import copy
>>> a=[1,[1,2]]
>>> b=copy.deepcopy(a) #深拷贝,深拷贝,我们是深拷贝,从此a和他的儿子孙子都跟我们没关系
>>> b
[1, [1, 2]]
>>> a.append(3)
>>> b
[1, [1, 2]]
>>> a[1].append(3)
>>> b
[1, [1, 2]] #我还是我^_^
#>_<
折腾了半天,一开始看代码,感觉这是什么鬼问题,定位后,才发现,原来还是对python不够了解。看来还是要继续深入。