5. NumPy使用（下）-CSDN博客

本文链接：https://blog.csdn.net/qq_19645269/article/details/104982874

1. 通用的broadcasting准则

broadcasting的前提是运算是通过element-wise的运算

从尾部开始依次比较维度
是否相等
是否其中一个维度为1
依次进行比较，如果相等则跳过，如果不相等并且其中一个为1则可以进行broadcasting

例子：

# 可以进行broadcasting的例子
#一个图片的大小为： 2*2
# 乘以一个scalar  1*1 结果为2*2
a = np.arange(2*2).reshape(2,2)
b = a * 2
print(a) # [[0, 2], [4, 6]]
a (2,3)
b (3)

#不可以进行broadcasting的例子
a (2,3)
b (3,4)

#那怎么进行broadcasting呢
a = np.arange(3).reshape(3, 1) # [[0], [1], [2]] shape = [3, 1]
b = np.ones(2)    # [1, 1] shape = (2)
a + b  
# 则 a broadcasting列，b broadcating行，如下
a --> shape = (3,2)  b ---> shape = (3, 2)
a = [[0, 0],[1, 1],[2, 2]]
b = [[1, 1],[1, 1],[1, 1]]
所以a + b等于
[[1 , 1], [2, 2], [3, 3 ]]

2. 更高级的索引

除了通过slice和整数进行索引，array还可以通过整数array和boolean array进行索引
A: 当被索引的数组为1维的时候，返回数组和索引的shape一样

a = np.arange(6)  #[0, 1, 2, 3, 4, 5]
b = np.array([1, 3, 5])
a[b]  # [1, 3, 5]

b = np.array([[0, 1], [2, 3]])
a[b]  #[[0, 1], [2, 3]]

B:当索引的数组为多维的时候
如果被索引的数组为多维的时候，则索引数组的每个元素都表示被索引数组的第一个维度

a = np.array([[0, 1], [1, 2], [2, 3]])
b = np.array([[1], [0], [2]])
a[b]  # [[[1, 2]], [[0, 1]], [[2, 3]]]

i = np.array([1, 2, 0])
j = np.array([0, 1, 1])
a[i, j]  # [1, 3, 1] #同样和索引的维度是相同的。
l = [i, j]
a[l] #和上面相同

# 但是如果将i,j放入到array中就会被解析成，索引第一个维度
m = np.array(i, j)
a[m] 
#如果把m转换为list或者是tuple则可以对元素进行索引
a[tuple(m)]
a[list(m)]

总结：第一类：array[array]: 则为第一维度的索引
第二类：array[array1, array2]: 则为元素的索引
array[np.array(array1, array2)]:归为第一类
array[list(np.array(array1, array2))]: 归为第二类
array[tuple(np.array(array1, array2))] 归为第二类

C:求列中最大的数字

# 先求出列最大的索引
data = np.sin(np.arange(20)).reshape(5, 4)
index = data.argmax(axis=0) # 沿着行向下，即以列为单位
print(data[index, range(data.shape[1])]) 
#a:
[[ 0.          0.84147098  0.90929743  0.14112001]
 [-0.7568025  -0.95892427 -0.2794155   0.6569866 ]
 [ 0.98935825  0.41211849 -0.54402111 -0.99999021]
 [-0.53657292  0.42016704  0.99060736  0.65028784]
 [-0.28790332 -0.96139749 -0.75098725  0.14987721]]
# 每一列最大值
[0.98935825 0.84147098 0.99060736 0.6569866 ]

D: 如何通过boolean进行索引

# 如果索引数组和被索引数组的shape相同，可以挑选元素
a = np.arange(12).reshape(3, 4)
b = a  > 2
print(a[b]) # [3, 4, 5, 6, 7, 8, 9, 10, 11]

3. 一列tricks和Tips

A. 可以通过-1来进行自动推导

a = np.arange(6)
print(a.reshape(-1, 2)) #则输出的结果为（3, 2）

B. 可以通过vstack和hstack进行堆叠
v表示vertical垂直的
h表示horizontal 水平的

a = np.arange(5)
b = np.linspace(0,10,5)
c = np.vstack(a, b)
d = np.hstack(a, b)

C:画直方图

import matplotlib.pyplot as plt
import numpy as np

mu, sigma = 2, 0.3
v = np.random.normal(mu, sigma, 1000)
plt.hist(v, bins =1000) # bins 表示盒子的个数
plt.show()