Backbone 之 FPN：特征金字塔（Pytorch实现及代码解析）

2401_85112148

于 2024-05-29 12:01:01 发布

阅读量881

点赞数 17

分类专栏：作者\/ 文章标签： pytorch 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_85112148/article/details/139291930

版权

作者\/ 专栏收录该内容

30 篇文章 0 订阅

订阅专栏

首先对C5进行1×1卷积降低通道数得到P5，然后依次进行上采样得到P4、P3和P2，目的是得到与C4、C3与C2长宽相同的特征，以方便下一步进行逐元素相加。这里采用2倍最邻近上采样，即直接对临近元素进行复制，而非线性插值。

横向连接（Lateral Connection）：

目的是为了将上采样后的高语义特征与浅层的定位细节特征进行融合。高语义特征经过上采样后，其长宽与对应的浅层特征相同，而通道数固定为256，因此需要对底层特征C2至C4进行11卷积使得其通道数变为256，然后两者进行逐元素相加得到P4、P3与P2。由于C1的特征图尺寸较大且语义信息不足，因此没有把C1放到横向连接中。

卷积融合：

在得到相加后的特征后，利用3×3卷积对生成的P2至P4再进行融合，目的是消除上采样过程带来的重叠效应，以生成最终的特征图。

如何选择特征图：

对于实际的物体检测算法，需要在特征图上进行**RoI（Region of Interests，感兴趣区域）**提取，而FPN有4个输出的特征图，选择哪一个特征图上面的特征也是个问题。FPN给出的解决方法是，对于不同大小的RoI，使用不同的特征图，大尺度的RoI在深层的特征图上进行提取，如P5，小尺度的RoI在浅层的特征图上进行提取，如P2。

FPN将深层的语义信息传到底层，来补充浅层的语义信息，从而获得了高分辨率、强语义的特征，在小物体检测、实例分割等领域有着非常不俗的表现。

具体代码：

import torch.nn as nn

import torch.nn.functional as F

import math

##先定义ResNet基本类，或者可以说ResNet的基本砖块

class Bottleneck(nn.Module):

expansion = 4 ##通道倍增数

def init(self, in_planes, planes, stride=1, downsample=None):

super(Bottleneck, self).init()

self.bottleneck = nn.Sequential(

nn.Conv2d(in_planes, planes, 1, bias=False),

nn.BatchNorm2d(planes),

nn.ReLU(inplace=True),

nn.Conv2d(planes, planes, 3, stride, 1, bias=False),

nn.BatchNorm2d(planes),

nn.ReLU(inplace=True),

nn.Conv2d(planes, self.expansion * planes, 1, bias=False),

nn.BatchNorm2d(self.expansion * planes),

)

self.relu = nn.ReLU(inplace=True)

self.downsample = downsample

def forward(self, x):

identity = x

out = self.bottleneck(x)

if self.downsample is not None:

identity = self.downsample(x)

out += identity

out = self.relu(out)

return out

##FPN类

class FPN(nn.Module):

def init(self, layers):

super(FPN, self).init()

self.inplanes = 64

###下面四句代码代表处理输入的C1模块–对应博客中的图

self.conv1 = nn.Conv2d(3, 64, 7, 2, 3, bias=False)

self.bn1 = nn.BatchNorm2d(64)

self.relu = nn.ReLU(inplace=True)

self.maxpool = nn.MaxPool2d(3, 2, 1)

###搭建自下而上的C2,C3,C4,C5

self.layer1 = self._make_layer(64, layers[0])

self.layer2 = self._make_layer(128, layers[1], 2)

self.layer3 = self._make_layer(256, layers[2], 2)

self.layer4 = self._make_layer(512, layers[3], 2)

###定义toplayer层，对C5减少通道数，得到P5

self.toplayer = nn.Conv2d(2048, 256, 1, 1, 0)

###代表3*3的卷积融合，目的是消除上采样过程带来的重叠效应，以生成最终的特征图。

self.smooth1 = nn.Conv2d(256, 256, 3, 1, 1)

self.smooth2 = nn.Conv2d(256, 256, 3, 1, 1)

self.smooth3 = nn.Conv2d(256, 256, 3, 1, 1)

###横向连接，保证通道数目相同

self.latlayer1 = nn.Conv2d(1024, 256, 1, 1, 0)

self.latlayer2 = nn.Conv2d( 512, 256, 1, 1, 0)

self.latlayer3 = nn.Conv2d( 256, 256, 1, 1, 0)

##作用：构建C2-C5砖块，注意stride为1和2的区别：得到C2没有经历下采样

def _make_layer(self, planes, blocks, stride=1):

downsample = None

if stride != 1 or self.inplanes != Bottleneck.expansion * planes:

downsample = nn.Sequential(

nn.Conv2d(self.inplanes, Bottleneck.expansion * planes, 1, stride, bias=False),

nn.BatchNorm2d(Bottleneck.expansion * planes)

)

###初始化需要一个list，代表左侧网络ResNet每一个阶段的Bottleneck的数量

关注

17
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
Backbone 之 FPN：特征金字塔（Pytorch实现及代码解析）

首先对C5进行1×1卷积降低通道数得到P5，然后依次进行上采样得到P4、P3和P2，目的是得到与C4、C3与C2长宽相同的特征，以方便。这里采用。
复制链接

扫一扫

专栏目录

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄58天

81: 原创

-: 周排名

-: 总排名

4万+: 访问

: 等级

1944: 积分

802: 粉丝

986: 获赞

5: 评论

974: 收藏

私信

关注

热门文章

分类专栏

作者\/ 30篇

最新评论

各种 IntelliJ IDEA 酷炫插件推荐
Evgenii Kudelevskii: 这里还有一个适用于 Gitee 的插件，也支持拉取请求： https://plugins.jetbrains.com/plugin/24174-gitee-pull-requests
cmd里MySQL常用命令
小林学习编程: 博主的文章总是带着深入的研究和独到的见解，对我的学习起到了巨大的帮助。文章总是深入浅出，让我不再觉得学习新知识困难。期待更多的干货和学习资源！博主的付出和分享令人钦佩。谢谢你，继续前行！
Gradle项目的jar发布到私有仓库
晨春计: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。