在之前的文章介绍视图的时候用了这样一段示例代码
arr = np.array([[1,2,3],
[4,5,6],
[7,8,9]])
arr1 = arr[:2]
print(id(arr),id(arr1),id(arr[0]),id(arr1[0]))
arr1[0][0] = 10
arr1.shape = (3,2)
print(arr,'\n',arr1)
2890993705584 2890993705680 2890993707024 2890993707024
[[10 2 3]
[ 4 5 6]
[ 7 8 9]]
[[10 2]
[ 3 4]
[ 5 6]]
其中看出虽然arr1
是arr
的视图,但arr1的shape
改变后并不会改变arr0
这是由于ndarray数组的内部结构决定的,下图为ndarray的内部结构:
-
一个指向数据(内存或内存映射文件中的一块数据)的指针。
-
数据类型或 dtype,描述在数组中的固定大小值的格子。
-
一个表示数组形状(shape)的元组,表示各维度大小的元组。
-
一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。
简单来说就是分为两个部分,一部分存储数组的结构信息如数组的形状(shape)、数据类型(data-type)等信息,另一部分存储数组的数据
而创建的视图仅仅是引用了原数组的数据,与原数组的结构信息是相互独立的,这也就是为什么改变了视图的shape却不会影响原数组的shape
ndarray.base()
函数可以判断数组中的数据是否来自于别的数组ndarray.flags.owndata
可以判断数组是否是数据的所有者
因此通过这两个函数我们就能够判断一个数组是另一个数组的视图还是副本
arr = np.array([[1,2,3],
[4,5,6],
[7,8,9]])
arr1 = arr[:2]
arr1[0][0] = 10
arr1.shape = (3,2)
print("ndarray.base:")
print(arr.base)
print(arr1.base)
print(arr1.base is arr)
print('\n')
print("ndarray.flags.owndata:")
print(arr.flags.owndata)
print(arr1.flags.owndata)
ndarray.base:
None
[[10 2 3]
[ 4 5 6]
[ 7 8 9]]
True
ndarray.flags.owndata:
True
False
由上可以看出arr
数据来自自己,而不是其他数组,arr
是数组中数据的所有者。而arr1
而是引用arr
数组中的数据,并不是数据的所有者
arr = np.array([[1,2,3],
[4,5,6],
[7,8,9]])
arr1 = arr.copy()
print("ndarray.base:")
print(arr.base)
print(arr1.base)
print('\n')
print("ndarray.flags.owndata:")
print(arr.flags.owndata)
print(arr1.flags.owndata)
ndarray.base:
None
None
ndarray.flags.owndata:
True
True
而创建的副本可以看出是完全相互独立的。