深度学习之检测模型-FPN

本文深入探讨了特征金字塔网络(FPN)在深度学习物体检测中的作用,介绍了FPN的构建原理、在RPN和RCNN中的应用,以及一系列实验证明其在提高检测精度和尺度不变性方面的优势。
摘要由CSDN通过智能技术生成

Feature pyramids are as basic component in recognition systems for detecting objects at different scales.
in this paper, we exploit the inherent multi-scale, pyramids hierarchy of deep convolutional networks to construct feature pyramids with marginal extra cost. A top-down architecture with lateral connections is developed for building high-level semantis feature maps at all scales.

简介

利用金字塔方法去检测不同尺度下的物体,已经在很多方面进行了应用。

  • 传统方法:SIFT,HOG –> DPM
  • 深度学习:SSD

结构如下:


这里写图片描述

  • a) 利用图像金字塔构建特征金字塔,然后针对不同尺度进行分别独立计算【速度慢】
  • b) 利用单个最高层的特征层去计算【目前流行的方法】
  • c) 针对ConvNet中的不同尺度,分别去计算【卷积神经网络在特征金字塔上拥有天然的优势】
  • d) 本文提出了一种新的方法,在b,c基础上,增加了横向连接【精度更高】

分析:

  • 特征层越高,特征表达能力越强【覆盖的信息越多】
  • 特征层越低,特征表达能力相对较弱【覆盖的信息较少】
  • 将两者有机的结合在一起,可以更佳丰富不同尺度下的特征表达能力。

特征金字塔Feature Pyramid Networks


这里写图片描述

说明:

  • 特征金字塔总的每一层都是和上一层的特征融合
  • 卷积网络的最高层网络C5通过一个1x1卷积生成金字塔的最高层P5
  • 其他卷积层都是通过上一层的金字塔特征上采样和对应的卷积层(经过1x1卷机)相加得到
  • 金字塔特征中的每一层都进过一个3x3的卷积,生成最终的特征
  • 所有的金字塔特征中的每一层的深度都是256-d
  • 所有额外的卷积都【上述提到的1x1卷积和3x3卷积】不采用非线性激活函数
  • 特征金字塔上的每一层特征都进行检测和分类
  • 特征金字塔与卷积层对应关系 { P2,P3,P4,P5} –> { C2,C3,C
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值