副本是一个数据的完整的拷贝,如果我们对副本进行修改,它不会影响到原始数据,物理内存不在同一位置
视图是数据的一个别称或引用,通过该别称或引用亦便可访问、操作原有数据,但原有数据不会产生拷贝。如果我们对视图进行修改,它会影响到原始数据,物理内存在同一位置
视图一般发生在:
-
numpy 的切片操作返回原数据的视图
-
调用 ndarray 的 view() 函数产生一个视图
副本一般发生在:
-
Python 序列的切片操作,调用deepCopy()函数
-
调用 ndarray 的 copy() 函数产生一个副本
无复制
简单的赋值不会创建数组对象的副本。 相反,它使用原始数组的相同id()来访问它。 id()返回 Python 对象的通用标识符,类似于 C 中的指针。
此外,一个数组的任何变化都反映在另一个数组上。 例如,一个数组的形状改变也会改变另一个数组的形状
In [1]: import numpy as np
In [2]: x = np.arange(6)
In [3]: x
Out[3]: array([0, 1, 2, 3, 4, 5])
In [4]: id(x)
Out[4]: 4578016672
In [5]: y = x
In [6]: y
Out[6]: array([0, 1, 2, 3, 4, 5])
In [7]: id(y)
Out[7]: 4578016672
In [8]: y.shape = 3, 2
In [9]: y
Out[9]:
array([[0, 1],
[2, 3],
[4, 5]])
In [10]: x
Out[10]:
array([[0, 1],
[2, 3],
[4, 5]])
视图或浅拷贝
ndarray.view()
函数
会创建一个新的数组对象,该方法创建的新数组的维数更改不会更改原始数据的维数
In [1]: import numpy as np
In [2]: x = np.arange(6).reshape(3,2)
In [3]: x
Out[3]:
array([[0, 1],
[2, 3],
[4, 5]])
In [4]: y = x.view()
In [5]: y
Out[5]:
array([[0, 1],
[2, 3],
[4, 5]])
In [6]: id(x), id(y)
Out[6]: (4553375952, 4557138240)
In [7]: y.shape = 2, 3
In [8]: y
Out[8]:
array([[0, 1, 2],
[3, 4, 5]])
In [9]: x
Out[9]:
array([[0, 1],
[2, 3],
[4, 5]])
使用切片创建视图修改数据会影响到原始数组:
In [1]: import numpy as np
In [2]: arr = np.arange(12)
In [3]: arr
Out[3]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])
In [4]: a = arr[3:]
In [5]: b = arr[3:]
In [6]: a[1] = 123
In [7]: b[2] = 234
In [8]: arr
Out[8]: array([0, 1, 2, 3, 123, 234, 6, 7, 8, 9, 10, 11])
In [9]: id(a), id(b), id(arr[3:])
Out[9]: (4480557104, 4589075712, 4589136192)
变量 a,b 都是 arr 的一部分视图,对视图的修改会直接反映到原数据中。但是我们观察 a,b 的 id,他们是不同的,也就是说,视图虽然指向原数据,但是他们和赋值引用还是有区别的
副本或深拷贝
ndarray.copy()
函数
创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置
In [1]: import numpy as np
In [2]: x = np.array([[10,10], [2,3], [4,5]])
In [3]: x
Out[3]:
array([[10, 10],
[ 2, 3],
[ 4, 5]])
In [4]: y = x.copy()
In [5]: y
Out[5]:
array([[10, 10],
[ 2, 3],
[ 4, 5]])
In [6]: y is x
Out[6]: False
In [7]: y[0, 0] = 100
In [8]: y
Out[8]:
array([[100, 10],
[ 2, 3],
[ 4, 5]])
In [9]: x
Out[9]:
array([[10, 10],
[ 2, 3],
[ 4, 5]])