numpy高级索引有一种方式为用一个数组来访问另一个数组的元素。这个数组中的每个元素都是目标数组中某个维度上的索引值。当数组索引和数组广播结合时有些不直观,本文介绍两者结合的用法。
import numpy as np
x = np.array([[1, 2], [3, 4], [5, 6]])
y = x[[0,1,2], [0,1,0]]
print (y)
#[1 4 5]
索引矩阵在原数组每个维度的大小应该相同。上例中x有两个维度,y的两个索引大小都为[3,],一个存储横坐标,一个存储纵坐标。
但是加入矩阵广播机制则可以更灵活处理索引。
testNP = np.array([i for i in range(90)]).reshape(5,6,3)
test = testNP[np.arange(3)[:,None],np.arange(2)[None,:],:]
print(test)
[[[ 0 1 2]
[ 3 4 5]]
[[18 19 20]
[21 22 23]]
[[36 37 38]
[39 40 41]]]
np.arange(3)[:,None]是一个[3,1]的矩阵,np.arange(2)[None,:]是一个[1,2]的矩阵。两个矩阵大小不一样当时都可以广播为[3,2]的矩阵,分别为:
[[0 0]
[1 1]
[2 2]]
[[0 1]
[0 1]
[0 1]]
上面两个矩阵分别表示x第一个维度、第二个维度的索引值,最后得到[2,3]的索引结果。由于第三个维度为全切片,所以最终y的索引数组大小为[2,3,3]。
总结:numpy会先检查每个维度的索引数组大小,如果大小不相等就先广播复制为相等大小的矩阵再做切片。