论文R-FCN:Object Detection via Region-based Fully Convolutional Networks学习总结
提出问题:在使用AlexNet和VGG Nets网络时,由于其在设计上由两个子网络组成:一个卷积子网络以空间池化层结束,后面是几个全连接层。因此,在目标检测网络中自然地通过感兴趣区域RoI池化层进行划分,划分为两个子网络:(1)独立于RoI的共享“全卷积”子网络,(2)不共享计算的RoI子网络。
但是随着神经网络的发展,提出了ResNet和GoogLeNets是全卷积的。因此类比提出在目标检测架构中使用所有卷积层来构建共享的卷积子网络,使得RoI的子网络没有隐藏层。然而,这个解决方案检测精度很差。
作者提出这种不平衡是由于增加图像分类的变换不变性与目标检测的平移可变性而导致的困境。
解决方法:为了将平移可变性并入FCN,我们通过使用一组专门的卷积层作为FCN输出来构建一组位置敏感的分数图。在这个FCN之上,我们添加了一个位置敏感的RoI池化层,它从这些分数图中获取信息,并且后面没有权重(卷积/fc)层。
R-FCN详解:
主干结构:基于ResNet-101,删除最后的平均池化层和全连接层,保留前100卷积层,只使用卷积层来计算特征映射