【目标检测实验系列】YOLOv5创新点：模型与Ghost卷积结构结合，降低参数量和GFLOPs的同时，保持精度不下降，模型轻量化必备！（内含源代码，超详细改进代码流程）

最新推荐文章于 2025-04-06 00:26:30 发布

弗兰随风小欢

最新推荐文章于 2025-04-06 00:26:30 发布

阅读量5.1k

点赞数 20

分类专栏：目标检测实验系列文章标签：目标检测 YOLO 人工智能 YOLOv5 深度学习 Ghost卷积深度可分离卷积

本文链接：https://blog.csdn.net/qq_32575047/article/details/135511495

版权

目标检测实验系列专栏收录该内容

23 篇文章

订阅专栏

自我介绍：本人硕士期间全程放养，目前成果:一篇北大核心CSCD录用,两篇中科院三区已见刊，一篇中科院四区在投。如何找创新点，如何放养过程厚积薄发，如何写中英论文，找期刊等等。本人后续会以自己实战经验详细写出来，还请大家能够点个关注和赞，收藏一下，谢谢大家。

1. 文章主要内容

本篇博客主要涉及轻量化Ghost卷积结构融合到YOLOv5模型中。（通读本篇博客需要7分钟左右的时间）。

2. 详细代码改进流程

2.1 C3Ghost源代码

博主这里使用YOLOv5 C3结构与Ghost融合成的C3Ghost结构，其结构在YOLOv5 6.x版本以上，会在common.py文件中提供，大家直接调用，如果找不到，大家自行创建一个C3Ghost.py文件，我在下面给出了其源代码。

class C3Ghost(C3):
    # C3 module with GhostBottleneck()
    def __init__(self, c1, c2, n=1, shortcut=True, g=1, e=0.5):
        super().__init__(c1, c2, n, shortcut, g, e)
        c_ = int(c2 * e)  # hidden channels
        self.m = nn.Sequential(*(GhostBottleneck(c_, c_) for _ in range(n)))
class GhostBottleneck(nn.Module):
    # Ghost Bottleneck https://github.com/huawei-noah/ghostnet
    def __init__(self, c1, c2, k=3, s=1):  # ch_in, ch_out, kernel, stride
        super().__init__()
        c_ = c2 // 2
        self.conv = nn.Sequential(
            GhostConv(c1, c_, 1, 1),  # pw
            DWConv(c_, c_, k, s, act=False) if s == 2 else nn.Identity(),  # dw
            GhostConv(c_, c2, 1, 1, act=False))  # pw-linear
        self.shortcut = nn.Sequential(DWConv(c1, c1, k, s, act=False), Conv(c1, c2, 1, 1,
                                                                            act=False)) if s == 2 else nn.Identity()

    def forward(self, x):
        return self.conv(x) + self.shortcut(x)

class GhostConv(nn.Module):
    # Ghost Convolution https://github.com/huawei-noah/ghostnet
    def __init__(self, c1, c2, k=1, s=1, g=1, act=True):  # ch_in, ch_out, kernel, stride, groups
        super().__init__()
        c_ = c2 // 2  # hidden channels
        self.cv1 = Conv(c1, c_, k, s, None, g, act)
        self.cv2 = Conv(c_, c_, 5, 1, None, c_, act)

    def forward(self, x):
        y = self.cv1(x)
        return torch.cat((y, self.cv2(y)), 1)
class DWConv(Conv):
    # Depth-wise convolution class
    def __init__(self, c1, c2, k=1, s=1, act=True):  # ch_in, ch_out, kernel, stride, padding, groups
        super().__init__(c1, c2, k, s, g=math.gcd(c1, c2), act=act)

另外，C3Ghost在YOLOv5位置上建议放在Neck部分，因为C3Ghost属于轻量化结构，而Backbone又处于提取数据特征的关键位置，如果将C3Ghost放在Backbone，有可能导致因为轻量化卷积结构不稠密而提取的特征不丰富，导致降点比较严重。博主亲自试验过，放在Neck部分会更好。至于替换Neck部分四个C3结构的几个，大家自行做一些消融的实验即可。

2.2 建立一个yolov5-C3Ghost.yaml文件

注意到，这里博主直接使用C3Ghost代替Backbone部分的四个C3结构,另外注意nc改为自己数据集的类别数。

# YOLOv5 🚀 by Ultralytics, GPL-3.0 license

# Parameters
nc: 4  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8  小目标
  - [30,61, 62,45, 59,119]  # P4/16 中目标
  - [116,90, 156,198, 373,326]  # P5/32  大目标

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2  output_channel, kernel_size, stride, padding
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3Ghost, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3Ghost, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3Ghost, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)
  
   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]