FPN 网络
1. 前言
通常在神经网络中,浅层特征图(feature maps)的感受野比较小,包含语义信息比较少,但是其空间位置信息准确,而深层网络,感受野大,语义信息强,但是由于 pooling 等造成了像素位置信息丢失等,所以空间位置信息比较粗糙。但是对于检测任务,往往既需要语义信息(分类),也需要位置信息(bbox),此外由于深层特征图往往被压缩到比较小的size,也会影响小目标的检测,因此低层和高层特征的融合是有必要的,而 FPN 就是一种特征融合的方式。
FPN(Feature Pyramid Networks) 是 Tsung-Yi Lin 等人于 2016 年在 Feature Pyramid Networks for Object Detection 提出的。FPN 的概念并不是凭空产生的,其实和图像金字塔的思想类似,只不过是特征层面的,所以叫 Feature Pyramid。
2. FPN
下面这幅图是作者在原文中给出来的示意图。
-
a 对某一输入图片我们通过压缩或放大从而形成一系列不同维度的图片,把这些图片分别输入模型,得到一系列的特征图(feature maap)的集合,这个集合就是可反映多维度信息的特征集。这种方法原本一张图变成了多张,因此对计算机的算力及内存大小都有较高要求。
-
b 就是常见的,比如 RCNN 系列中的做法