1. 通用的broadcasting准则
broadcasting的前提是运算是通过element-wise的运算
- 从尾部开始依次比较维度
- 是否相等
- 是否其中一个维度为1
- 依次进行比较,如果相等则跳过,如果不相等并且其中一个为1则可以进行broadcasting
例子:
# 可以进行broadcasting的例子
#一个图片的大小为: 2*2
# 乘以一个scalar 1*1 结果为2*2
a = np.arange(2*2).reshape(2,2)
b = a * 2
print(a) # [[0, 2], [4, 6]]
a (2,3)
b (3)
#不可以进行broadcasting的例子
a (2,3)
b (3,4)
#那怎么进行broadcasting呢
a = np.arange(3).reshape(3, 1) # [[0], [1], [2]] shape = [3, 1]
b = np.ones(2) # [1, 1] shape = (2)
a + b
# 则 a broadcasting列,b broadcating行,如下
a --> shape = (3,2) b ---> shape = (3, 2)
a = [[0, 0],[1, 1],[2, 2]]
b = [[1, 1],[1, 1],[1, 1]]
所以a + b等于
[[1 , 1], [2, 2], [3, 3 ]]
2. 更高级的索引
除了通过slice和整数进行索引,array还可以通过整数array和boolean array进行索引
A: 当被索引的数组为1维的时候,返回数组和索引的shape一样
a = np.arange(6) #[0, 1, 2, 3, 4, 5]
b = np.array([1, 3, 5])
a[b] # [1, 3, 5]
b = np.array([[0, 1], [2, 3]])
a[b] #[[0, 1], [2, 3]]
B:当索引的数组为多维的时候
如果被索引的数组为多维的时候,则索引数组的每个元素都表示被索引数组的第一个维度
a = np.array([[0, 1], [1, 2], [2, 3]])
b = np.array([[1], [0], [2]])
a[b] # [[[1, 2]], [[0, 1]], [[2, 3]]]
i = np.array([1, 2, 0])
j = np.array([0, 1, 1])
a[i, j] # [1, 3, 1] #同样和索引的维度是相同的。
l = [i, j]
a[l] #和上面相同
# 但是如果将i,j放入到array中就会被解析成,索引第一个维度
m = np.array(i, j)
a[m]
#如果把m转换为list或者是tuple则可以对元素进行索引
a[tuple(m)]
a[list(m)]
总结: 第一类:array[array]: 则为第一维度的索引
第二类:array[array1, array2]: 则为元素的索引
array[np.array(array1, array2)]:归为第一类
array[list(np.array(array1, array2))]: 归为第二类
array[tuple(np.array(array1, array2))] 归为第二类
C:求列中最大的数字
# 先求出列最大的索引
data = np.sin(np.arange(20)).reshape(5, 4)
index = data.argmax(axis=0) # 沿着行向下,即以列为单位
print(data[index, range(data.shape[1])])
#a:
[[ 0. 0.84147098 0.90929743 0.14112001]
[-0.7568025 -0.95892427 -0.2794155 0.6569866 ]
[ 0.98935825 0.41211849 -0.54402111 -0.99999021]
[-0.53657292 0.42016704 0.99060736 0.65028784]
[-0.28790332 -0.96139749 -0.75098725 0.14987721]]
# 每一列最大值
[0.98935825 0.84147098 0.99060736 0.6569866 ]
D: 如何通过boolean进行索引
# 如果索引数组和被索引数组的shape相同,可以挑选元素
a = np.arange(12).reshape(3, 4)
b = a > 2
print(a[b]) # [3, 4, 5, 6, 7, 8, 9, 10, 11]
3. 一列tricks和Tips
A. 可以通过-1来进行自动推导
a = np.arange(6)
print(a.reshape(-1, 2)) #则输出的结果为(3, 2)
B. 可以通过vstack和hstack进行堆叠
v表示vertical垂直的
h表示horizontal 水平的
a = np.arange(5)
b = np.linspace(0,10,5)
c = np.vstack(a, b)
d = np.hstack(a, b)
C:画直方图
import matplotlib.pyplot as plt
import numpy as np
mu, sigma = 2, 0.3
v = np.random.normal(mu, sigma, 1000)
plt.hist(v, bins =1000) # bins 表示盒子的个数
plt.show()