FPN 笔记

最新推荐文章于 2022-10-08 13:55:11 发布

农民工小陈

最新推荐文章于 2022-10-08 13:55:11 发布

阅读量806

点赞数 1

本文链接：https://blog.csdn.net/weixin_42102248/article/details/102607006

版权

前言
1.本文重点是FPN要解决的问题以及具体怎么做的，尽量用较少篇幅表达清楚论文算法，其他一些不影响理解算法的东西不做赘述
2.博客主要是学习记录，为了更好理解和方便以后查看，当然如果能为别人提供帮助就更好了，如果有不对的地方请指正（论文中的链接是我经过大量搜索，个人认为讲解最清楚的参考）

论文链接
 代码链接
 论文翻译

创新点
1.利用特征金字塔进行多尺度特征图的融合及分别预测

问题引出
在目标检测中有一个一直存在的问题“多尺度，小目标”很难解决，一些传统算法用图像金字塔来解决这个问题，但是图像金字塔用在当今流行的深度卷积网络中计算量太大，导致现在很多检测算法回避这个问题，也有一些算法尝试用特征金字塔来代替图像金字塔，但在小目标检测上还是不太理想，FPN提出一种自上向下、带有侧向连接的层次结构来构建各个尺度的高层语义特征（FPN是一种通用的特征提取器，本身不是检测算法，需要和其他检测算法结合才能使用）
在这里插入图片描述
上图中：
a）图像金字塔，将图像缩放成不同尺度，然后在不同尺度图像上提取不同尺度的特征，计算量太大
b）高层特征图具有较高的语义信息，有些算法直接用最后一层特征图进行预测，例如R-CNN系列、YOLO
c）除了图像金字塔可以用来处理多尺度的物体，深度网络本身具有的多层次结构也可以用来提取多尺度的特征，SSD就利用了多个特征图分别做预测，但是SSD没有用到足够低层的特征（在SSD中，最低层的特征是VGG网络的conv4_3），作者认为足够低层的特征对于检测小物体是很有帮助的
d）FPN将上层特征上采样和下层特征融合，并且每层分别预测
在这里插入图片描述
低层的特征语义信息比较少，但是有高分辨率信息，利于定位；顶层分辨率低，但是有较高的语义信息，利于分类。也有一些算法尝试将上层特征上采样与下一层融合，进行多次融合，但是用的是最后一层特征图进行预测（上图中上半部分图所示，下半部分图为FPN）

FPN算法
FPN包含两个过程，一个是自底向上的过程，第二个是自顶向下和侧向连接的融合过程

1.自底向上
自底向上的过程就是网络的前向传播，前向传播的过程中特征图经过一些层会变小，还有一些层不会减小特征图尺寸（padding操作），将不减小特征图尺寸的层归为一个stage，每次抽取一个stage中最后一层组成特征金字塔，以ResNet为例，选取conv2、conv3、conv4、conv5层的最后一个残差block层特征作为FPN的特征，记为{C2、C3、C4、C5}，这几个特征层相对于原图的步长分别为4、8、16、32

2.自顶向下过程以及侧向连接
将上层的特征图上采样（FPN用的是简单的最邻近插值）到和下层特征图相同的尺寸，再分别通过1×1卷积使上下特征图通道数一致，然后按像素相加（此时经过上采样和卷积上下特征图已经同尺寸同通道数），如下图所示

最低0.47元/天解锁文章

农民工小陈

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
FPN 笔记

说明1.本文是博主的学习记录，主要为了方便以后查看，当然如果能为别人提供帮助就更好了，如果有不对的地方请指正2.本文重点是了解FPN要解决的问题以及具体怎么做的，尽量用较少篇幅表达清楚论文整体思路，其他一些不影响理解论文算法的东西有需要的请查看其他博客3.论文中的链接是我经过大量搜索，个人认为讲解最清楚的参考，看本文的过程中如对一些名词有疑惑可以直接点击参考链接原论文代码论文翻译创新...
复制链接

扫一扫