YoloV4-tiny网络结构搭建

YoloV4-tiny网络结构图

一、基本的卷积块Conv + BN + LeakyReLU

#   卷积块
#   Conv2d + BatchNorm2d + LeakyReLU
#-------------------------------------------------#
class ConvBNLeaky(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, stride=1):
        super(ConvBNLeaky, self).__init__()

        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride, kernel_size//2, bias=False)
        self.bn = nn.BatchNorm2d(out_channels)
        self.activation = nn.LeakyReLU(0.1)

    def forward(self, x):
        x = self.conv(x)
        x = self.bn(x)
        x = self.activation(x)
        return x

二、定义Resblock_body结构

#   CSPdarknet53-tiny的结构块
#   存在一个大残差边
#   这个大残差边绕过了很多的残差结构
#---------------------------------------------------#
class Resblock_body(nn.Module):
    def __init__(self, in_channels, out_channels):
        super(Resblock_body, self).__init__()
        self.out_channels = out_channels

        self.conv1 = ConvBNLeaky(in_channels, out_channels, 3)

        self.conv2 = ConvBNLeaky(out_channels//2, out_channels//2, 3)
        self.conv3 = ConvBNLeaky(out_channels//2, out_channels//2, 3)

        self.conv4 = ConvBNLeaky(out_channels, out_channels, 1)
        self.maxpool = nn.MaxPool2d([2,2],[2,2])

    def forward(self, x):
        # 利用一个3x3卷积进行特征整合
        x = self.conv1(x)
        # 引出一个大的残差边route
        route = x
        
        c = self.out_channels
        # 通过split对特征层的通道进行分割,将通道进行二均等分,取第二部分作为主干部分。
        x = torch.split(x, c//2, dim = 1)[1]
        # 对主干部分进行3x3卷积
        x = self.conv2(x)
        # 引出一个小的残差边route_1
        route1 = x
        # 对第主干部分进行3x3卷积
        x = self.conv3(x)
        # 主干部分与小残差部分进行相接
        x = torch.cat([x,route1], dim = 1) 

        # 对相接后的结果进行1x1卷积
        x = self.conv4(x)
        feat = x
        # 主干部分与大残差边进行相接
        x = torch.cat([route, x], dim = 1)
        
        # 利用最大池化进行高和宽的压缩
        x = self.maxpool(x)
        return x,feat

三、主干网络Backbone部分

class CSPDarkNet(nn.Module):
    def __init__(self):
        super(CSPDarkNet, self).__init__()
        # 首先利用两次步长为2x2的3x3卷积进行高和宽的压缩
        # 416,416,3 -> 208,208,32 -> 104,104,64
        self.conv1 = ConvBNLeaky(3, 32, kernel_size=3, stride=2)
        self.conv2 = ConvBNLeaky(32, 64, kernel_size=3, stride=2)

        # 104,104,64 -> 52,52,128
        self.resblock_body1 =  Resblock_body(64, 64)
        # 52,52,128 -> 26,26,256
        self.resblock_body2 =  Resblock_body(128, 128)
        # 26,26,256 -> 13,13,512
        self.resblock_body3 =  Resblock_body(256, 256)
        # 13,13,512 -> 13,13,512
        self.conv3 = ConvBNLeaky(512, 512, kernel_size=3)

        self.num_features = 1
        # 进行权值初始化
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                n = m.kernel_size[0] * m.kernel_size[1] * m.out_channels
                m.weight.data.normal_(0, math.sqrt(2. / n))
            elif isinstance(m, nn.BatchNorm2d):
                m.weight.data.fill_(1)
                m.bias.data.zero_()


    def forward(self, x):
        # 416,416,3 -> 208,208,32 -> 104,104,64
        x = self.conv1(x)
        x = self.conv2(x)

        # 104,104,64 -> 52,52,128
        x, _    = self.resblock_body1(x) #前两个resblock_body不需要输出feat分支
        # 52,52,128 -> 26,26,256
        x, _    = self.resblock_body2(x) #前两个resblock_body不需要输出feat分支
        # 26,26,256 -> x为13,13,512
        #           -> feat1为26,26,256
        x, feat1    = self.resblock_body3(x) #输出feat1分支,后面会用到,feat1为26,26,256

        # 13,13,512 -> 13,13,512
        x = self.conv3(x)
        feat2 = x #feat2就是主干网络最后的输出13,13,512,后面会接上FPN层
        return feat1,feat2

def darknet53_tiny(pretrained, **kwargs):
    model = CSPDarkNet()
    if pretrained:
        model.load_state_dict(torch.load("model_data/CSPdarknet53_tiny_backbone_weights.pth"))
    return model

四、YOLOv4-tiny网络结构的构建

1、构建卷积 + 上采样模块(共有一处)

#---------------------------------------------------#
#   卷积 + 上采样
#---------------------------------------------------#
class Upsample(nn.Module):
    def __init__(self, in_channels, out_channels):
        super(Upsample, self).__init__()

        self.upsample = nn.Sequential(
            ConvBNLeaky(in_channels, out_channels, 1),
            nn.Upsample(scale_factor=2, mode='nearest')
        )

    def forward(self, x,):
        x = self.upsample(x)
        return x

2、yolo_head部分(有两个)

#---------------------------------------------------#
#   最后获得yolov4的输出
#   filters_list是一个列表[512, len(anchors_mask[0]) * (5 + num_classes)]
#---------------------------------------------------#
def yolo_head(filters_list, in_filters):
    m = nn.Sequential(
        ConvBNLeaky(in_filters, filters_list[0], 3),
        nn.Conv2d(filters_list[0], filters_list[1], 1),
    )
    return m

3、构建YoloBody

#   yolo_body
#---------------------------------------------------#
class YoloBody(nn.Module):
    def __init__(self, anchors_mask, num_classes, pretrained=False):
        super(YoloBody, self).__init__()
        self.backbone = darknet53_tiny(pretrained)

        self.conv_for_P5 = ConvBNLeaky(512, 256, 1)  # 主干网络后面紧接着的卷积层
        self.yolo_headP5 = yolo_head([512, len(anchors_mask[0]) * (5 + num_classes)], 256)

        self.upsample = Upsample(256, 128)  # 包含卷积 + 上采样
        self.yolo_headP4 = yolo_head([256, len(anchors_mask[1]) * (5 + num_classes)], 384)

    def forward(self, x):
        # ---------------------------------------------------#
        #   生成CSPdarknet53_tiny的主干模型
        #   feat1的shape为26,26,256
        #   feat2的shape为13,13,512
        # ---------------------------------------------------#
        feat1, feat2 = self.backbone(x)

        # 13,13,512 -> 13,13,256
        P5 = self.conv_for_P5(feat2)
        # 13,13,256 -> 13,13,512 -> 13,13,255
        out0 = self.yolo_headP5(P5)

        # 13,13,256 -> 13,13,128 -> 26,26,128
        P5_Upsample = self.upsample(P5)  # 再将P5经过一个卷积层和上采样层
        # 26,26,256 + 26,26,128 -> 26,26,384
        P4 = torch.cat([P5_Upsample, feat1], axis=1)  # 将P5_Upsample,feat1进行拼接

        # 26,26,384 -> 26,26,256 -> 26,26,255
        out1 = self.yolo_headP4(P4)

        return out0, out1

reference

Pytorch 搭建自己的YoloV4-tiny目标检测平台(Bubbliiiing 深度学习 教程)_哔哩哔哩_bilibili

  • 7
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: YOLOv4-tiny是一种目标检测网络,并且是YOLOv4的轻量级版本。下面是YOLOv4-tiny网络结构图的解释。 YOLOv4-tiny主要由两个部分组成:主干网络(Backbone)和检测头(Detection Head)。 主干网络部分包含了一系列的卷积层和池化层。它由多个Convolution模块组成,每个模块包含了一层卷积操作和一层上采样操作。这些模块的作用是提取输入图像的特征。相比YOLOv4YOLOv4-tiny使用了更少的卷积模块和更少的卷积核,以减小网络的参数量和计算复杂度。 检测头部分是YOLOv4-tiny的关键组成部分,它负责从主干网络提取的特征图中预测目标的边界框和类别概率。检测头包含了多个卷积层和全连接层。首先,它通过一个卷积层将特征图从高维度空间转换为低维度空间。然后,它使用多个卷积层和全连接层来预测不同尺度下的边界框和类别概率。 YOLOv4-tiny的最后一层是一个输出层,该层将预测的边界框和类别概率输出到目标检测任务中。每个输出包含了一组边界框和类别概率,其中每个边界框由4个坐标值表示,并且每个类别概率表示了检测到该类别的置信度。 总体来说,YOLOv4-tiny网络结构图显示了一个经过精心设计的轻量级目标检测模型,它可以在保持较高准确率的同时降低参数量和计算复杂度,从而实现实时目标检测任务的高效执行。 ### 回答2: YOLOv4-tiny是一种轻量级目标检测网络,由于其结构图较为复杂,下面我将用300字进行解释。 YOLOv4-tiny网络结构图由输入层、多个卷积层、连接层、多个残差模块、头部层以及最终输出层组成。 首先,输入层接收输入图像的数据,并将其传递给下一层。接下来是多个卷积层,这些层使用不同的卷积核对输入图像进行特征提取,使得网络能够辨识图像中的各种特征。 连接层用于连接卷积层和残差模块。残差模块是YOLOv4-tiny网络的重要组成部分,它通过引入残差学习,有助于网络快速地学习到图像的特征和表征。 头部层位于网络的顶部,负责对提取的特征进行解码和处理。头部层包括卷积层、上采样层、特征融合层等,通过这些层的嵌套运算,网络能够对特征进行更详细和准确的分析。 最终输出层用于网络的最后一步,它将头部层输出的特征映射转换为边界框信息和类别概率,以便实现目标检测和分类。 总的来说,YOLOv4-tiny网络结构图层次清晰,通过一系列的卷积层、连接层、残差模块和头部层的组合,能够有效地实现图像的目标检测任务。 ### 回答3: YOLOv4-tiny是一种轻量级的目标检测网络结构,被广泛应用于计算资源受限的场景中。其网络结构图如下所示: 输入图像经过首层卷积层,提取图像特征。接着,使用残差块模块对特征图进行处理,提高特征的表达能力。然后,再使用池化操作进行下采样,将特征图的尺寸减小。 在处理完特征图后,通过两个小型卷积层获得高级特征。接着,借助于SPP结构,将不同尺度的特征图进行拼接,以综合多种层次的信息。 在拼接后的特征图上,使用多个3x3卷积层来进一步提取特征,并使用步长为2的卷积层进行下采样,减小特征图的尺寸。这样可以使得网络具有更大的感受野,能够检测到更大尺寸的目标。 最后,经过一系列的卷积层和全连接层,以及使用线性整流单元(ReLU)激活函数和批归一化操作来提高网络的非线性表达能力和鲁棒性。 YOLOv4-tiny网络结构图总体上较为简单,但仍然能够在计算资源受限的情况下高效地检测目标。其通过提取不同层次的特征信息和使用步长卷积层进行下采样,实现了高效的目标检测。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值