众所周知,卷积神经网络的卷积层会产生一个三维的矩阵:W*H*K。如何将三维的转化为二维的,并加以利用呢?
R-MAC(Regional Maximum Activation of Convolutions)方法是一个十分常用的方法。
该方法在论文《PARTICULAR OBJECT RETRIEVAL WITH INTEGRAL MAX-POOLING OF CNN ACTIVATIONS》有详细介绍。
1.产生regions
首先,需要强调的一点,regions产生在feature maps上,而不是在原图上。
在L个不同的尺度上产生正方形regions。在最大的尺度(l=1)上,region的尺寸最大。如图所示,依次为l=1,2,3。