Feature pyramids are as basic component in recognition systems for detecting objects at different scales.
in this paper, we exploit the inherent multi-scale, pyramids hierarchy of deep convolutional networks to construct feature pyramids with marginal extra cost. A top-down architecture with lateral connections is developed for building high-level semantis feature maps at all scales.
简介
利用金字塔方法去检测不同尺度下的物体,已经在很多方面进行了应用。
- 传统方法:SIFT,HOG –> DPM
- 深度学习:SSD
结构如下:
- a) 利用图像金字塔构建特征金字塔,然后针对不同尺度进行分别独立计算【速度慢】
- b) 利用单个最高层的特征层去计算【目前流行的方法】
- c) 针对ConvNet中的不同尺度,分别去计算【卷积神经网络在特征金字塔上拥有天然的优势】
- d) 本文提出了一种新的方法,在b,c基础上,增加了横向连接【精度更高】
分析:
- 特征层越高,特征表达能力越强【覆盖的信息越多】
- 特征层越低,特征表达能力相对较弱【覆盖的信息较少】
- 将两者有机的结合在一起,可以更佳丰富不同尺度下的特征表达能力。
特征金字塔Feature Pyramid Networks
说明:
- 特征金字塔总的每一层都是和上一层的特征融合
- 卷积网络的最高层网络C5通过一个1x1卷积生成金字塔的最高层P5
- 其他卷积层都是通过上一层的金字塔特征上采样和对应的卷积层(经过1x1卷机)相加得到
- 金字塔特征中的每一层都进过一个3x3的卷积,生成最终的特征
- 所有的金字塔特征中的每一层的深度都是256-d
- 所有额外的卷积都【上述提到的1x1卷积和3x3卷积】不采用非线性激活函数
- 特征金字塔上的每一层特征都进行检测和分类
- 特征金字塔与卷积层对应关系 { P2,P3,P4,P5} –> { C2,C3,C