【论文笔记】Slim-neck by GSConv

原创

已于 2023-07-18 20:36:44 修改 · 3.3w 阅读

318 ·

CC 4.0 BY-SA版权

文章标签：

#论文阅读

于 2023-05-18 17:08:33 首次发布

文章目录

前言
1. 简介
2. GSConv
4. 为什么要在Neck中使用GSConv
3. Slim-Neck
- Slim-Neck中的模块
- Slim-Neck针对YOLO系列的设计
一些问题
总结
References

前言

在这里插入图片描述
作者提出了一种新方法GSConv来减轻模型复杂度，保持准确性。GSConv可以更好地平衡模型的准确性和速度。并且，提供了一种设计范式Slim-Neck，以实现检测器更高的计算成本效益。实验过程中，与原始网络相比，改进方法获得了最优秀的检测结果。

论文地址：https://arxiv.org/abs/2206.02424

Github：https://github.com/AlanLi1997/Slim-neck-by-GSConv

1. 简介

目标检测是计算机视觉中一项艰巨的下游任务。对于车载边缘计算平台，大模型很难达到实时检测的要求。而且，由大量深度可分离卷积层构建的轻量级模型无法达到足够的准确性。因此本文引入了一种新方法 GSConv 来减轻模型的复杂度并保持准确性。GSConv 可以更好地平衡模型的准确性和速度。并且，提供了一种设计范式，Slim-Neck，以实现检测器更高的计算成本效益。在实验中，与原始网络相比，本文方法获得了最先进的结果（例如，SODA10M 在 Tesla T4 上以 ~100FPS 的速度获得了 70.9% mAP0.5）

MobileNet、ShuffleNets这些轻量级模型都采用了DSC操作来提升检测器的速度。但是当这些模型应用于自动驾驶汽车的时候，准确性就不够了。

但是，DSC 的缺点也很明显：输入图像的通道信息在计算过程中是分离的。
在这里插入图片描述
对于自动驾驶，速度和准确性同样重要。通过 GSConv 引入了 Slim-Neck 方法，以减轻模型的复杂度同时可以保持精度。GSConv 更好地平衡了模型的准确性和速度。

如上图所示，作者在SODA10M无人驾驶数据集上比较了最先进了Slim Neck 检测器和原始检测器的速度和准确度，并证实了该方法的有效性。

2. GSConv

在这里插入图片描述
通过上图可以知道，GSConv首先输入进行一个普通卷积的下采样，然后使用DWConv深度卷积，并将两个conv的结果拼接起来（一个SC一个DSC）；最后进行shuffle操作，让之前两个卷积的对应通道数挨在一起，通过上方图片也可以看出来。（表述的可能不太清楚，看图片我觉得要清晰一点哈哈哈）

搭配代码食用或许能更好理解一点：

class GSConv(nn.Module):
    def __init__(self, c1, c2, k=1, s=1, g=1, act=True):
        super().__init__()
        c_ = c2 // 2
        self.cv1 = Conv(c1, c_, k, s, None, g, act)	# g:gract：分组卷积
        self.cv2 = Conv(c_, c_, 5,

最低0.47元/天解锁文章

27 条评论

顾辞柒 2025.08.04
图画的有问题啊

hub902 2024.11.29
TypeError: conv2d() received an invalid combination of arguments - got (Tensor, Parameter, NoneType, tuple, tuple, tuple, int), but expected one of: * (Tensor input, Tensor weight, Tensor bias = None, tuple of ints stride = 1, tuple of ints padding = 0, tuple of ints dilation = 1, int groups = 1) didn't match because some of the arguments have invalid types: (Tensor, !Parameter!, !NoneType!, !tuple of (int, int)!, !tuple of (int, int)!, !tuple of (bool, bool)!, !int!) * (Tensor input, Tensor weight, Tensor bias = None, tuple of ints stride = 1, str padding = "valid", tuple of ints dilation = 1, int groups = 1) didn't match because some of the arguments have invalid types: (Tensor, !Parameter!, !NoneType!, !tuple of (int, int)!, !tuple of (int, int)!, !tuple of (bool, bool)!, !int!) 这是为什么，使用GSConv和VoVGSCSP就会报这个错
- qq_58494418回复hub902 2024.12.12
  大佬，这个解决了吗，我也遇到了

2301_76149246 2024.11.11
RuntimeError: Sizes of tensors must match except in dimension 1. Expected size 4 but got size 5 for tensor number 1 in the list.

m0_58351407 2024.05.14
使用GSConv时，必须要用VoVGSCSP吗
- 还没入门的菜坤回复m0_70855384 2024.06.19
  老哥替换之后task文件里面怎么修改呢
- m0_70855384回复m0_58351407 2024.05.28
  不用吧，我单独使用GSConv替换标准卷积也可以的

feng121_tongxue 2024.04.16
图5是你自己画的吗，跟原文的图根本对不起来，GSbottleneck少了一个卷积
- 一只逍遥猫回复feng121_tongxue 2024.09.12
  我看了官方代码，作者画的GSbottleneck好像就是缺少个卷积吧
- feng121_tongxue回复feng121_tongxue 2024.04.16
  不好意思，你是根据代码来画的哈哈哈搞错了

Deus_Chaos 2024.02.21
这个图5的VoVGSCSP真的没有画错吗？

星光中的一点黑暗 2024.01.04
看这个GSConv的代码，怎么没见深度可分离卷积的代码啊？
- ~山风-回复努力学遥感的小姜 2025.06.20
  但是没有1*1的卷积啊，这样只是一个深度卷积而已
- 努力学遥感的小姜回复星光中的一点黑暗 2024.01.18
  深度可分离卷积就是在普通卷积中将group通道数与输入通道对齐

bluelan9 2023.10.31
请问GSconv的GS是什么词的缩写？
- 2201_75937961回复bluelan9 2024.10.05
  其实是Group Shuffle Convolution的缩写
- CAU_NICDF回复bluelan9 2023.12.29
  Ghost-Shuffle Convolution (GSConv)
- bluelan9回复bluelan9 2023.10.31
  还有vovgscsp又代表啥意思[face]emoji:013.png[/face]

小赵每天都来学习 2023.08.01
这个SC是普通卷积吗？还是自校正卷积
- 小赵每天都来学习回复JehanRio 2023.08.02
  好的，谢谢大佬
- JehanRio回复小赵每天都来学习 2023.08.02
  通过代码也能看出是标准卷积
- JehanRio回复小赵每天都来学习 2023.08.02
  就是普通卷积（Standard Convolution），可能有歧义了这一点写的，然后DSC就是深度可分离卷积