通常,当您使用数组以这种方式索引另一个数组时,numpy期望每个数组R,C等具有相同的形状.例如,假设您要从此数组中提取非零值:
>>> a
array([[1, 3, 0, 0],
[0, 0, 0, 0],
[2, 4, 0, 0],
[0, 0, 0, 0]])
您将创建一个行索引R数组:
>>> R
array([[0, 2],
[0, 2]])
并且列索引C的数组:
>>> C
array([[0, 0],
[1, 1]])
并将它们传递进去:
>>> a[R, C]
array([[1, 2],
[3, 4]])
请注意,这些可以是您喜欢的任何形状 – 输出将采用相同的形状:
>>> RR
array([0, 2, 0, 2])
>>> CC
array([0, 0, 1, 1])
>>> a[RR, CC]
array([1, 2, 3, 4])
但是,如果您的索引数组中有重复,那么您可以通过使用广播来省去一些麻烦.唯一的问题是结果数组必须是可广播的.这意味着你需要明确地给它们额外的尺寸.我将使用切片语法来保留额外的维度.
>>> r = R[0:1,:]
>>> c = C[:,0:1]
>>> r
array([[0, 2]])
>>> c
array([[0],
[1]])
>>> a[r, c]
array([[1, 2],
[3, 4]])
如果你没有明确地给它们额外的尺寸,numpy会尽力理解你已经传递的东西,但它并不总是按预期工作.用0替换0:1切片会删除额外的维度:
>>> rr = r[0,:]
>>> cc = c[:,0]
>>> rr
array([0, 2])
>>> cc
array([0, 1])
>>> a[rr, c]
array([[1, 2],
[3, 4]])
>>> a[r, cc]
array([[1, 4]])
>>> a[rr, cc]
array([1, 4])
第一个([rr,c])是有效的,因为numpy可以从c的形状告诉它应该广播.但另外两个是模棱两可的,所以numpy假设你并不意味着他们被广播.
但是,请注意numpy还提供了使平面阵列可播放的快捷方式.这可以派上用场!
>>> a[numpy.ix_(rr, cc)]
array([[1, 3],
[2, 4]])