第七章 ndarray的赋值、视图、拷贝和广播

NumPy入门教程

第一章 NumPy 介绍
第二章 ndarray的创建及其属性
第三章 ndarray的基本操作
第四章 ndarray的索引、切片和遍历
第五章 ndarray的重塑、组合和拆分
第六章 用于ndarray的文件操作
第七章 ndarray的赋值、视图、拷贝和广播



前言

上一章我们讲述了用于 ndarray 的文件操作。本章我们来讲述 ndarray 的赋值、视图、拷贝和广播。


一、赋值

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1
>>>
>>> my_arr1
array([0, 1, 2, 3, 4, 5])
>>> my_arr2
array([0, 1, 2, 3, 4, 5])

在上面的代码中,将 my_arr1 赋值给 my_arr2,这时不会创建新的数组对象,只是多了一个引用,my_arr1my_arr2 是同一个数组的两个名字。当我们改变 my_arr1 的形状时,my_arr2 的形状也会跟着改变,例如:

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1
>>>
>>> my_arr2.shape = (2, 3)
>>>
>>> my_arr2
array([[0, 1, 2],
       [3, 4, 5]])
>>> my_arr1
array([[0, 1, 2],
       [3, 4, 5]])

上面的代码中,my_arr2 的形状改变后,my_arr1 的形状也发生了相应的改变。

二、视图

视图方法可以实现不同的数组对象共享同样的数据。例如:

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.view()
>>>
>>> my_arr2 is my_arr1
False
>>> my_arr2.base is my_arr1
True
>>> my_arr2.flags.owndata
False

从上述代码的输出可以看出,my_arr1my_arr2 是两个不同的对象,my_arr2my_arr1 的视图,my_arr2 没有自己的数据。当 my_arr2 的形状发生改变时,my_arr1 的形状并不会发生改变。但是,当 my_arr2 的数据发生改变时,my_arr1 会发生同样的改变。例如:

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.view()
>>>
>>> my_arr2.shape = (2, 3)
>>>
>>> my_arr1.shape
(6,)
>>> my_arr2.shape
(2, 3)
>>> my_arr2[0, 1] = 10
>>> my_arr1
array([ 0, 10,  2,  3,  4,  5])

综上所述,我们可以得出视图相对于原来的数组来说,除了数据是共享的,其他都是独立的。另外,前面介绍的切片操作,得到的也是一个数组的视图。例如:

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_slice = my_arr1[2:4]
>>> my_slice[:] = 10
>>>
>>> my_arr1
array([ 0,  1, 10, 10,  4,  5])

从上面的代码可以得出,当改变切片的数据时,原数组的数据也跟着进行了相应的改变。


三、拷贝

从上述内容可以看出,不管是赋值还是视图,对其中一个数组的改变都会影响另外一个。那么有没有一种方法使得两者会不干扰,答案是有的,那便是拷贝。copy() 方法会生成数组的一个完整的拷贝,包括其数据。例如:

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.copy()
>>>
>>> my_arr2 is my_arr1
False
>>> my_arr2.base is my_arr1
False

从上述代码的输出可以看出,my_arr1my_arr2 是两个独立的数组。对其中一个数组中元素的改变不会影响另外一个数组:

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1.copy()
>>>
>>> my_arr2[2] = 10
>>>
>>> my_arr1
array([0, 1, 2, 3, 4, 5])
>>> my_arr2
array([ 0,  1, 10,  3,  4,  5])

四、广播

广播(broadcasting)指的是不同形状的数组之间的算术运算的执行方式。它是一种非常强大的功能,但也容易令人误解,将标量值跟数组合并时就会发生最简单的广播,例如:

>>> import numpy as np
>>>
>>> my_arr1 = np.arange(6)
>>> my_arr2 = my_arr1 * 6
>>>
>>> my_arr2
array([ 0,  6, 12, 18, 24, 30])

这里我们说,在这个乘法运算中,标量值 6 被广播到了其他所有的元素上。下面继续来看一个例子,我们可以通过减去列平均值的方式对数组的每一列进行距平化处理。这个问题解决起来非常简单,代码如下:

>>> import numpy as np
>>>
>>> my_arr1 = np.random.randn(4, 3)
>>> demeaned = my_arr1 - my_arr1.mean(0)
>>>
>>> demeaned
array([[ 1.60676516,  0.59110315,  0.74905798],
       [-0.57334534, -0.07311742,  0.5865966 ],
       [-0.57913031, -0.24058561, -0.09102391],
       [-0.45428951, -0.27740012, -1.24463067]])
>>> demeaned.mean(0)
array([ 0.00000000e+00, -5.55111512e-17,  5.55111512e-17])

在上面的例子中,my_arr1.mean(0) 是一个 1 行 3 列的数组,当我们用一个 4 行 3 列的数组减去一个 1 行 3 列的数组时,便会对 1 行 3 列的数组进行广播。广播过程的图形化如下图所示:
在这里插入图片描述


总结

本章介绍了 ndarray 的赋值、视图、拷贝和广播。

上一章 用于 ndarray 的文件操作

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值