Fast R-CNN是Ross Girshick对R-CNN进行改进的一篇文章,影响力也比较大。R-CNN的基本思想是用box proposal的特征映射作为其特征向量,然后进行分类与box精调。但是R-CNN需要对每个box proposal进行卷积操作得到box特征映射,这样大大降低了检测效率。Fast R-CNN在R-CNN基本思想不变的情况下,只对原图做一次卷次操作得打特征映射,然后把每个box投影到这个特征映射上去,得到box的特征映射。
本文会交替地使用“box proposal”和“RoI”(region of interest)。
网络
RoI投影到特征映射上
首先计算卷积网络的输入图像 H1∗W1 和特征映射 H2∗W2 的比
spatial_scal