关于resnet,其巧妙地利用了shortcut连接,解决了深度网络中模型退化的问题。网络结构如下
FPN的目的
熟悉faster rcnn的人都知道,faster rcnn利用的是vgg的最后卷积特征,大小是7*7*512.而这造成了一个问题,经过多次卷积之后的特征通常拥有很大的感受野,它们比较适合用来检测大物体,或者说,它们在检测小物体任务上效果很差,所以像ssd和fpn这样的网络思想就是将前面和后面的卷积层都拿出来,组成一个multiscale 结果,既能检测大物体,也能检测小物体。
基于这个思想,fpn从resnet 34层模型构造了一组新的特征,p2,p3,p4,p5,每一个p_i都是resnet中不同卷积层融合的结果,这保证了他们拥有多尺度信息,他们拥有相同的维度,都是256。
bottom-up就是简单的使用了ResNet34,主要是top-down中的思想。
在上文中我们提到c2-c5的大小和维度分别是56x56x64,28x28x128,14x14x256,7x7x512,所以在top-down中,先用了一个1x1x256的卷积将c5:7x7x512 变成了m5:7x7x256,