广播(Broadcasting)是 numpy 对不同形状(shape)的数组进行数值计算的一种方式。本文主要翻译自 Python Data Science Handbook 一书,习惯英文阅读可直接阅读原书:Computation on Arrays: Broadcasting
1. Broadcasting介绍
对两个形状相同的数组进行二元运算,等同于将数组中的对应位置进行二元运算:
Broadcasting允许在在形状不同的数组上进行这类二元运算,比如我们可以用一个数组加上一个标量:
这里我们可以看做标量5
被“复制”成了一个和数组a
形状相同的数组[5, 5, 5]
(这个复制操作就是broadcasting,但是在broadcasting中并不是真的复制了数组,并没有增加新的内存,“复制”只是我们理解broadcasting的一种简单的方式) ,再与a
相加,如下图所示 :
我们也可以对更高维的数组进行broadcasting,比如一个二维数组和一个一维数组相加:
这里一维数组a
为了和M
的形状匹配,它通过broadcast从(1, 3)->(3, 3)
,如下图所示:
上述例子仅在一个维度进行广播,还有一个跟复杂的情况,如在数组的两个维度都需要进行broadcast:
这里的a.shape=(1, 3)
、b.shape=(3, 1)
,为了得到最终的结果,a
和b
都需要在不同的维度上进行broadcast,如下图所示:
2. Broadcasting规则
以上介绍了很多boroadcasting实例,但是例子往往是无穷无尽的。想要完全掌握broadcast机制,我们只需要记住它在进行运算时的三条规则:
- 规则1:让所有输入数组都向其中形状最长的数组看齐,形状中不足的部分都通过在前面(左侧)补 1
注:形状其实就是指the number of dimensions。比如计算a+b
,其中a.shape=(2, 2, 3)
、b.shape=(2, 3)
,那么数组b
将被broadcast为b.shape=(1, 2, 3)
- 规则2:如果两个数组的形状在任何维度上均不匹配,但是某个数组中某一个维度为1,则该维度中形状为1的数组将被拉伸以匹配另一个数组对应维度形状
注:这里实际上是保证可以在某一个维度做broadcasting,比如计算a+b
,其中a.shape=(1, 3)
、b.shape=(3, 1)
,那么根据规则2,这两个数组会boradcast为a.shape=(3, 3)
、b.shape=(3, 3)
- 规则3:如果两个数组的形状在任何维度上均不匹配,且均没有等于1的维度,则会报错。
下面通过三个例子来理解这三个规则。
例1
M.shape=(2, 3)
a.shape=(3, )
---规则1-->M.shape=(2, 3)
a.shape=(1, 3)
---规则2-->M.shape=(2, 3)
a.shape=(2, 3)
---最终输出形状-->(2, 3)
,如下图所示:
例2
a.shape=(3, 1)
b.shape=(3, )
---规则1-->a.shape=(3, 1)
b.shape=(1, 3)
---规则2-->a.shape=(3, 3)
b.shape=(3, 3)
---最终输出形状-->(3, 3)
,如下图所示:
例3
M.shape=(3, 2)
a.shape=(3, )
---规则1-->M.shape=(3, 2)
a.shape=(1, 3)
---规则2-->M.shape=(3, 2)
a.shape=(3, 3)
---规则3-->两个数组broadcast之后的形状并不相同,报错。
3. Broadcasting应用
应用1:一组数据,使其均值为0,如下所示:
应用2:画函数图像,如下所示:
x.shape=(50,)
y.shape=(50, 1)
---规则1-->x.shape=(1, 50)
y.shape=(50, 1)
---规则2-->x.shape=(50, 50)
y.shape=(50, 50)
---最终输出形状-->(50, 50)
参考文献
【1】Computation on Arrays: Broadcasting
【2】NumPy 广播(Broadcast)
若有侵权,请联系我删除相关内容,谢谢。