问题背景
最近正在看faster-rcnn的anchor-target-layer.py源码,其中关于numpy的argmax()问题搞得很混乱。此问题理清楚还需要高清楚numpy的索引的运作原理。
a = np.array([[1,3,5],[2,2,9]])
>>> a.argmax(axis=0)
array([1, 0, 1])
使用argmax(axis=0)的原因是想提取出在行方向上的最大值序号。进而得到行方向上的最大值(每一列的最大值)。可以看出的结构是一个1行3列的array,其中array中的每个值都小于行数,并且值得个数是列数。可以通过以下语句得到行方向上的最大值。
>>> a[a.argmax(axis=0),np.arange(3)]
array([2, 3, 9])
同理,可以得到列方向上的最大值,(每一行的最大值)
>>> a[np.arange(2),a.argmax(axis=1)]
array([5, 9])
argmax函数返回的是序号,在二维情况下,axis=0对应行,axis=1对应列。argmax(axis=0),返回的是行号,行号的个数是列数。同理可知。
在以上操作中
>>>[a.argmax(axis=0),np.arange(3)]
[array([1, 0, 1]), array([0, 1, 2])]
可见,两个array做为序号,其实内部使用的是数据组合机制来获取真实的数据。以上可以等效为
[a[1,0],a[0,1],a[1,2]]
如此便可以理解了。