YOLOv5

最新推荐文章于 2024-09-18 18:58:04 发布

北落师门XY

最新推荐文章于 2024-09-18 18:58:04 发布

阅读量2k

点赞数 2

分类专栏： ML、DL

本文链接：https://blog.csdn.net/weixin_41819299/article/details/118226022

版权

ML、DL 专栏收录该内容

34 篇文章 5 订阅

订阅专栏

———————————yolov5—————————

有YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x四个版本，只有模型宽度与深度的区别。

四个组成部分：

输入端：对输入图像进行缩放、归一化、数据增强等操作

backbone基准网络：分类器网络提取特征

Neck网络：进一步提升特征的表达能力

Predition/Head输出端：预测，进行回归分类

基础组件及其实现脚本

CBL

即Conv+BN+Leaky_relu。

CBM

由2个cbl组成的一种残差结构

CSP1_X

由cbl、cbm组成，x为cbm数量，即图中x个残差组件

进一步特征融合

CSP2_X

由cbl组成，x为cbl数量，即图中2*x个

Focus

将多个slice结果Concat起来，然后将其送入CBL模块中。

目的是剪裁特征图，使特征图数量减少，通道变多。

class Focus(nn.Module):
    # Focus wh information into c-space
    def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True): # ch_in, ch_out, kernel, stride, padding, groups
        super(Focus, self).__Cblinit__()
        self.conv = Conv(c1 * 4, c2, k, s, p, g, act)
        # self.contract = Contract(gain=2)

    def forward(self, x): # x(b,c,w,h) -> y(b,4c,w/2,h/2)
        return self.conv(torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1))
        # return self.conv(self.contract(x))