问题引入:
R-CNN、SPP net、Fast R-CNN等目标检测算法,它们proposals都是事先通过selecetive search方法得到。然而,这一过程将耗费大量的时间,从而影响目标检测系统的实时性。Faster R-CNN针对这一问题,提出了Region Proposal Network(RPN),利用RPN模型来得到proposals,此外,为了节省时间,该模型与目标检测模型Fast R-CNN模型共享卷积层,这样实现了端到端的目标检测。
Region Proposal Network(RPN):
RPN模型以任意大小的图像作为输入,输出一系列候选目标框,以及每个候选目标框是目标的可能性。
对于ZF模型,假设给定600*1000的输入图像,最后一个共享的卷积层输出的特征图,可以看作是尺度为51*39的256通道的图像。对于该图像上的每一个位置,考虑9个可能的候选窗口,即:三种面积{128*128, 256*256, 515*512},三种比列{1:1, 1:2, 2:1},这些候选窗口称为anchors。图1中有51*39个anchor中心,以及9种anchor示例。
图1