NumPy入门教程
第一章 NumPy 介绍
第二章 ndarray的创建及其属性
第三章 ndarray的基本操作
第四章 ndarray的索引、切片和遍历
第五章 ndarray的重塑、组合和拆分
第六章 用于ndarray的文件操作
第七章 ndarray的赋值、视图、拷贝和广播
前言
上一章我们讲述了用于 ndarray 的文件操作。本章我们来讲述 ndarray 的赋值、视图、拷贝和广播。
一、赋值
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1
>>>
>>> my_arr1
array([0, 1, 2, 3, 4, 5])
>>> my_arr2
array([0, 1, 2, 3, 4, 5])
在上面的代码中,将 my_arr1
赋值给 my_arr2
,这时不会创建新的数组对象,只是多了一个引用,my_arr1
和 my_arr2
是同一个数组的两个名字。当我们改变 my_arr1
的形状时,my_arr2
的形状也会跟着改变,例如:
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1
>>>
>>> my_arr2.shape = (2, 3)
>>>
>>> my_arr2
array([[0, 1, 2],
[3, 4, 5]])
>>> my_arr1
array([[0, 1, 2],
[3, 4, 5]])
上面的代码中,my_arr2
的形状改变后,my_arr1
的形状也发生了相应的改变。
二、视图
视图方法可以实现不同的数组对象共享同样的数据。例如:
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.view()
>>>
>>> my_arr2 is my_arr1
False
>>> my_arr2.base is my_arr1
True
>>> my_arr2.flags.owndata
False
从上述代码的输出可以看出,my_arr1
和 my_arr2
是两个不同的对象,my_arr2
是 my_arr1
的视图,my_arr2
没有自己的数据。当 my_arr2
的形状发生改变时,my_arr1
的形状并不会发生改变。但是,当 my_arr2
的数据发生改变时,my_arr1
会发生同样的改变。例如:
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.view()
>>>
>>> my_arr2.shape = (2, 3)
>>>
>>> my_arr1.shape
(6,)
>>> my_arr2.shape
(2, 3)
>>> my_arr2[0, 1] = 10
>>> my_arr1
array([ 0, 10, 2, 3, 4, 5])
综上所述,我们可以得出视图相对于原来的数组来说,除了数据是共享的,其他都是独立的。另外,前面介绍的切片操作,得到的也是一个数组的视图。例如:
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_slice = my_arr1[2:4]
>>> my_slice[:] = 10
>>>
>>> my_arr1
array([ 0, 1, 10, 10, 4, 5])
从上面的代码可以得出,当改变切片的数据时,原数组的数据也跟着进行了相应的改变。
三、拷贝
从上述内容可以看出,不管是赋值还是视图,对其中一个数组的改变都会影响另外一个。那么有没有一种方法使得两者会不干扰,答案是有的,那便是拷贝。copy()
方法会生成数组的一个完整的拷贝,包括其数据。例如:
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.copy()
>>>
>>> my_arr2 is my_arr1
False
>>> my_arr2.base is my_arr1
False
从上述代码的输出可以看出,my_arr1
和 my_arr2
是两个独立的数组。对其中一个数组中元素的改变不会影响另外一个数组:
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.copy()
>>>
>>> my_arr2[2] = 10
>>>
>>> my_arr1
array([0, 1, 2, 3, 4, 5])
>>> my_arr2
array([ 0, 1, 10, 3, 4, 5])
四、广播
广播(broadcasting)指的是不同形状的数组之间的算术运算的执行方式。它是一种非常强大的功能,但也容易令人误解,将标量值跟数组合并时就会发生最简单的广播,例如:
>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1 * 6
>>>
>>> my_arr2
array([ 0, 6, 12, 18, 24, 30])
这里我们说,在这个乘法运算中,标量值 6 被广播到了其他所有的元素上。下面继续来看一个例子,我们可以通过减去列平均值的方式对数组的每一列进行距平化处理。这个问题解决起来非常简单,代码如下:
>>> import numpy as np
>>>
>>> my_arr1 = np.random.randn(4, 3)
>>> demeaned = my_arr1 - my_arr1.mean(0)
>>>
>>> demeaned
array([[ 1.60676516, 0.59110315, 0.74905798],
[-0.57334534, -0.07311742, 0.5865966 ],
[-0.57913031, -0.24058561, -0.09102391],
[-0.45428951, -0.27740012, -1.24463067]])
>>> demeaned.mean(0)
array([ 0.00000000e+00, -5.55111512e-17, 5.55111512e-17])
在上面的例子中,my_arr1.mean(0)
是一个 1 行 3 列的数组,当我们用一个 4 行 3 列的数组减去一个 1 行 3 列的数组时,便会对 1 行 3 列的数组进行广播。广播过程的图形化如下图所示:
总结
本章介绍了 ndarray 的赋值、视图、拷贝和广播。
上一章 用于 ndarray 的文件操作