DO-Conv无痛涨点：使用over-parameterized卷积层提高CNN性能

最新推荐文章于 2025-04-17 20:25:37 发布

我爱计算机视觉

最新推荐文章于 2025-04-17 20:25:37 发布

阅读量2.4k

点赞数

文章标签：卷积计算机视觉机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/moxibingdao/article/details/115388411

版权

本文介绍了DO-Conv，一种通过在卷积层中加入额外的Depthwise卷积来提高CNN性能的方法。DO-Conv在训练时加速网络收敛，同时在多种计算机视觉任务中展现出优于传统卷积的效果，而且在推理时计算量不变。通过实验，DO-Conv在图像分类、语义分割和目标检测等方面都显示了性能提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

DO-Conv: Depthwise Over-parameterized Convolutional Layer

论文：https://arxiv.org/pdf/2006.12030.pdf

代码：https://github.com/yangyanli/DO-Conv

0.动机

CNN应用于计算机视觉领域的很多任务中，增加CNN中线性层---非线性层的数量，能够增加网络的表达能力，从而提高网络的性能。

然而，很少有人考虑只增加线性层，只增加线性层会造成过拟合现象，因为多个连续的线性层可以被一个线性层替代，而使用一个线性层参数更少。

在这篇文章中，作者通过在一个普通的卷积层中加入额外的depthwise卷积操作，构成一个over-parameterized的卷积层，并将其命名为DO-Conv，通过实验证明，使用DO-Conv不仅能够加速网络的训练过程，还能在多种计算机视觉任务中取得比使用传统卷积层更好的结果。

在推理时，DO-Conv可以转换为传统的卷积操作，因此将一个网络中的传统卷积替换为DO-Conv并不会增加计算需求。

1.传统的卷积和Depthwise卷积

1.1 传统的卷积

给定输入feature map，传统的卷积操作使用滑动窗口的形式，将卷积核作用到feature map的窗口区域中。

假设feature map的通道数为，卷积核作用的窗口尺寸为，则卷积核作用的窗口可以表示为一个3维张量，记作，为便于后续说明，也可以将其表示为2维张量，即。

假设这个卷积层的输出feature map通道数为，一般使用4维张量表示卷积核，但是也可以用3维张量表示卷积核，记作。使用表示卷积操作，则可以表示如下：

上式中只是表示了输出feature map的1个通道的计算过程。上述表示以及计算过程如下图所示：

在上图中，，，。第一行的个元素与做点积运算，完成输出feature map第一个通道的计算，即的第一行。

1.2 Depthwise卷积

与传统卷积不同的是，在Depthwise卷积中，输出特征某个通道只与输入特征的某个通道和对应权重有关，与输入特征的其他通道无关。

对于某个特定通道的输入特征，

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。