这篇论文是《Faster R-CNN Features for Instance Search》。发表在2016的CVPR Workshops 上。
论文源码:https://github.com/imatge-upc/retrieval-2016-deepvision
首先给出网络结构图:
输入图像之后,使用Conv5_3层的feature map。
将feature map输入RPN网络,提取出RPN Proposals。对应回feature map,将proposals经过RoI Pooling。
这里RoI Pooling的意义在于,之前提取到的proposals大小不一,不利于后面的全连接。
具体做法是:将每个proposal分块,比如都分成3*3大小。然后在每个块中取最大值,这样每个proposal都变成了3*3大小。,实现了尺寸上的统一。如图所示。
三个全连接层之后,得到proposals属于各个类别的得分。
接着给出一些论文给出的概念和定义: