YoloV3 Darknet53 残差网络Residual

damon93

已于 2022-02-28 17:31:15 修改

阅读量2.1k

点赞数

分类专栏： yolov3 文章标签：网络 pytorch 深度学习

于 2022-02-28 15:15:08 首次发布

本文链接：https://blog.csdn.net/damon93/article/details/123182030

版权

yolov3 专栏收录该内容

3 篇文章 1 订阅

订阅专栏

本文介绍了在学习YoloV3目标检测模型时遇到的残差网络结构。YoloV3的主干网络Darknet53采用了残差块，通过1x1和3x3卷积来保持通道数的一致性，确保信息流畅。在每个layer中，首先使用步长为2的3x3卷积进行下采样，然后堆叠残差结构。代码展示了BasicBlock类定义了基本的残差块，并在make_layer函数中用于构建下采样的残差网络层。

摘要由CSDN通过智能技术生成

残差网络Residual

本文主要是记录在学习YoloV3时遇到的残差网络结构
文本参考睿智的目标检测26——Pytorch搭建yolo3目标检测平台
接触算法模型不久，有错误的话还望不吝批评。

先总览一下Yolov3模型结构(主干网络为Darknet53，左侧虚线框内)

在这里插入图片描述

对应的onnx网络结构

截取部分onnx网络结构说明残差网络结构，我直接训练得到的是pth的模型，转成onnx后可视化结果比较直观一些
需要注意的是在下面图片中BN被融合到Conv

对应的残差结构代码

基本残差块代码

#---------------------------------------------------------------------#
#   残差结构
#   利用一个1x1卷积下降通道数，然后利用一个3x3卷积提取特征并且上升通道数
#   最后接上一个残差边
#---------------------------------------------------------------------#
class BasicBlock(nn.Module):
    def __init__(self, inplanes, planes):
        super(BasicBlock, self).__init__()
        self.conv1  = nn.Conv2d(inplanes, planes[0], kernel_size=1, stride=1, padding=0, bias=False)
        self.bn1    = nn.BatchNorm2d(planes[0])
        self.relu1  = nn.LeakyReLU(0.1)
        
        self.conv2  = nn.Conv2d(planes[0], planes[1], kernel_size=3, stride=1, padding=1, bias=False)
        self.bn2    = nn.BatchNorm2d(planes[1])
        self.relu2  = nn.LeakyReLU(0.1)

    def forward(self, x):
        residual = x

        out = self.conv1(x)
        out = self.bn1(out)
        out = self.relu1(out)

        out = self.conv2(out)
        out = self.bn2(out)
        out = self.relu2(out)

        out += residual
        return out

配合下采样使用代码（构建R1、R2等）

    #---------------------------------------------------------------------#
    #   在每一个layer里面，首先利用一个步长为2的3x3卷积进行下采样
    #   然后进行残差结构的堆叠
    #---------------------------------------------------------------------#
    def _make_layer(self, planes, blocks):
        layers = []
        # 下采样，步长为2，卷积核大小为3
        layers.append(("ds_conv", nn.Conv2d(self.inplanes, planes[1], kernel_size=3, stride=2, padding=1, bias=False)))
        layers.append(("ds_bn", nn.BatchNorm2d(planes[1])))
        layers.append(("ds_relu", nn.LeakyReLU(0.1)))
        # 加入残差结构
        self.inplanes = planes[1]
        for i in range(0, blocks):
            layers.append(("residual_{}".format(i), BasicBlock(self.inplanes, planes)))
        return nn.Sequential(OrderedDict(layers))