resnet50、FPN、Panet结构及代码

最新推荐文章于 2024-07-15 15:54:24 发布

新生代农民工！

最新推荐文章于 2024-07-15 15:54:24 发布

阅读量8.9k

点赞数 9

分类专栏： pytorch 深度学习 python 文章标签：深度学习

本文链接：https://blog.csdn.net/TYtangyan/article/details/106592461

版权

本文介绍了Faster R-CNN、FPN和PANet在目标检测中的演进，重点阐述了FPN利用不同尺度特征图进行检测的概念，以及PANet如何通过开辟快速通道增强顶层和底层信息融合。内容还包含基于ResNet50特征提取的代码实现，讨论了图像尺寸处理策略。

摘要由CSDN通过智能技术生成

起初faster-r-cnn，只采用最后一层特作为rpn以及head部分的特征图，后来不断改进，有了FPN，再后来有了Panet，一般来说网络的层数越深它的语义信息越丰富。但是随着网络层数的加深，检测所需的位置信息就会越差，CNN分类网络只需要知道一张图像的种类即可所以很多时候网络越深效果越好，但是不是分类效果越好的网越适合检测。FPN如下图所示，它用了不同大小的特征图进行预测，图中：下方的特征图较大，对应的感受野较小可以用来检测小目标，上部分的特征图尺寸较小，但是感受野较大适合检测大目标。

Panet 是对FPN的改进，如下图红线所示，在fpn中顶层底层信息距离太远，不要看红线中间只有三四个框，这是一个示意，其中有好多的卷积操作所以顶层底层距离很远，所以在右侧开辟了一条新的路（绿线），只要几个个卷积层，顶层信息就能快速与底层信息汇合。特征提取对结果的影响特别大，融合不同尺度的信息十分必要，M2det在SSD的基础上增加了部分网络来优化特征提取，得到的效果就比SSD效果好得多

代码是基于resnet50的特征提取部分实现的，上一张resnet50的网络结构

具体实现如下，其中fpn参考mmdetection种fpn的结构，Panet部分自己写的，如有不对请告知。

其中图像经过下采样再进行上采样的时候有可能大小不同，某一层图像下采样前的尺寸为单数。可以提前计算图像大小对输入图像直接padding，我用的是上采样时直接输入尺寸。

import torch
from torch import nn
import torch.nn.functional as F


class Bottleneck(nn.Module):
    expansion = 4

    def __init__(self, in_size, size_u, stride=1, is_down=False):
        super(

最低0.47元/天解锁文章

新生代农民工！

关注

9
点赞
踩
89

收藏

觉得还不错? 一键收藏
7
评论
resnet50、FPN、Panet结构及代码

起初faster-r-cnn，只采用最后一层特作为rpn以及head部分的特征图，后来不断改进，有了FPN，一般来再后来有了Panet，网络的层数越深它的语义信息越丰富。但是随着网络层数的加深，检测所需的位置信息就会越差，CNN分类网络只需要知道一张图像的种类即可所以很多时候网络越深效果越好，但是不是分类效果越好的网越适合检测。FPN如下图所示，它用了不同大小的特征图进行预测，图中：下方的特征图较大，对应的感受野较小可以用来检测小目标，上部分的特征图尺寸较小，但是感受野较大适合检测大目标。...
复制链接

扫一扫

专栏目录