深度学习【35】CondenseNet

最新推荐文章于 2023-05-25 16:55:00 发布

DCD_Lin

最新推荐文章于 2023-05-25 16:55:00 发布

阅读量3k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/linmingan/article/details/79800956

版权

CondenseNet是一种轻量级深度学习模型，结合了denseNet的跳跃连接和shuffleNet的channel shuffle，但不使用depthwise 3*3卷积，而是采用可学习的分组卷积。通过condensation factor控制网络压缩，实现更高效的计算。相比mobilenet，CondenseNet在保持相似精度的同时，模型更小、计算量更低。论文中提出的学习分组卷积允许在训练期间根据卷积核的L1值进行稀疏化。实验结果显示CondenseNet在模型大小和计算量上有显著优势。

摘要由CSDN通过智能技术生成

condenseNet与mobilenet、shuffleNet一样都是小而精悍的模型。与shuffleNet一样都是为了优化1*1卷积的计算量。同时借鉴了denseNet的跳跃连接和shuffleNet的channel shuffle。但是没有使用mobilenet的depthwise 3*3卷积，而是使用了分组卷积。condenseNet比mobilenet模型小了6M，计算量小了2倍，同时在imageNet上的top1精度一样。当condenseNet的模型大小与mobilenet一样时，在imageNet上的top1比mobilenet少了3%.

condenseNet主要创新是提出了可学习的分组卷积，论文中主要是针对1*1卷积，当然也可以在其他大的卷积核中使用。

我们先看看标准卷积与分组卷积的差别，从下图可以看出，分组卷积有点像标准卷积的稀疏卷积版本。只是分组卷积没那么随机，每个组的输入图片之间的通道是不交叉的。
这里写图片描述
其实该论文提出的可学习分组卷积，就是利用了网络压缩技术中的稀疏网络原理。即在训练期间根据卷积核的L1值对卷积核进行置零操作。