02 FPN

目录

一、 FPN

1. 网络结构

2. 流程示例

二、 FPN应用于RPN


个人笔记

一、 FPN

Feature Pyramid Networks:解决物体检测算法在处理多尺度变化问题时的不足

Faster RCNN中RPN网络是基于单个高层特征。这是对小物体不友好

FPN本身不是检测算法,只是一个特征提取器。它需要和其他检测算法结合才能使用

详解FPN网络https://blog.csdn.net/qq_38890412/article/details/120776777?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522167931171516800186571971%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=167931171516800186571971&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~first_rank_ecpm_v1~hot_rank-4-120776777-null-null.142%5Ev74%5Econtrol,201%5Ev4%5Eadd_ask,239%5Ev2%5Einsert_chatgpt&utm_term=FPN%E7%BD%91%E7%BB%9C&spm=1018.2226.3001.4187

1. 网络结构

结构图如下:

 FPN包含两个部分:

自底向上的过程(左半部分):自底向上的过程和普通的CNN没有区别。现代的CNN网络划分为不同的stage,每个stage之间特征图的尺度比例相差为2。在FPN中,每个stage对应了一个特征金字塔的级别(level),并且每个stage的最后一层特征被选为对应FPN中相应级别的特征。以ResNet为例,选取conv2、conv3、conv4、conv5层的最后一个残差block层特征作为FPN的特征,记为{C2、C3、C4、C5}。这几个特征层相对于原图的步长分别为4、8、16、32。

自顶向下过程(右半部分)以及侧向连接

自顶向下的过程通过上采样(up-sampling)的方式将顶层的小特征图放大到上一个stage的特征图一样的大小。上采样的方法可以用最近邻差值实现。

侧向连接将上一层经过上采样后和当前层分辨率一致的特征,通过相加的方法进行融合。(这里为了修正通道数量,将当前层先经过1x1卷积操作)

2. 流程示例

以下图为例

  • C5层先经过1x1卷积,得到M5特征。
  • M5通过上采样,再加上C4经过1x1卷积后的特征,得到M4。
  • 这个过程再做两次,分别得到M3和M2。
  • M层特征再经过3x3卷积,得到最终的P2、P3、P4、P5层特征。M层的通道数都一样

二、 FPN应用于RPN

原始:Faster RCNN中的RPN是通过最后一层的特征来做的。对于特征层上的每一个点,作者用anchor的方式预设了9个框。这些框本身包含不同的尺度和不同的长款比例

改进:

  • FPN针对RPN的改进是应用到每一个P层。由于每个P层相对于原始图片具有不同的尺度信息,让每个P层只处理单一的尺度信息
  • 对{32^2、64^2、128^2、256^2、512^2}这五种尺度的anchor分别对应到{P2、P3、P4、P5、P6}这五个特征层上。每个特征层都处理1:1、1:2、2:1三种长宽比例的候选框。

注意P2-----P6面积是从小到大!!!P2主要是针对小目标,小面积;P6针对大目标,大面积

  • P6是专门为了RPN网络而设计的,用来处理512大小的候选框。它由P5经过下采样得到。

如图所示:

P2--P6  5个网络头部(P2--P6)的参数共享

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
FPN (Feature Pyramid Network) 是一种用于目标检测和语义分割任务的神经网络架构。它由 Tsung-Yi Lin 等人在论文 "Feature Pyramid Networks for Object Detection" 中提出。 FPN 的主要目标是解决目标检测任务中的多尺度问题。传统的目标检测方法通常使用单一尺度的特征图进行预测,这会导致小目标难以被准确检测到,而大目标则可能丢失细节信息。FPN 使用了一种金字塔式的特征提取方法,将不同尺度的特征图进行融合,以便在不同尺度上进行目标检测。 FPN 的核心思想是通过建立自顶向下和自底向上的路径来构建特征金字塔。自底向上的路径从底层的高分辨率特征图开始,通过下采样操作逐渐降低分辨率,生成一系列特征图。自顶向下的路径则通过上采样操作逐渐增加分辨率,将高层语义信息传递到低层特征图中。最后,不同层级的特征图通过横向连接进行融合,形成一个多尺度的特征金字塔。 在目标检测任务中,FPN 可以用作特征提取网络的一部分,提供多尺度的特征图用于目标检测器的预测。它可以帮助检测器更好地适应不同尺度的目标,并提高检测精度。 在语义分割任务中,FPN 可以用于生成密集的像素级预测。通过将特征金字塔的不同层级特征图进行上采样和融合,可以得到高分辨率的语义分割结果。 总结来说,FPN 是一种有效解决多尺度问题的神经网络架构,可用于目标检测和语义分割任务。通过构建特征金字塔,提供多尺度的特征图,从而提高模型在不同尺度上的表现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值