Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs（关于大核卷积的论文笔记）

errorwarn

已于 2024-01-28 15:24:48 修改

阅读量288

点赞数 9

文章标签：论文阅读

于 2024-01-28 15:24:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/errorworn/article/details/135885972

版权

摘要：

作者提出了一个提出了RepLKNet，一个纯CNN架构，其内核大小为31×31，而不是常用的3×3。此模型再一些经典的下游任务上获得了与Swin Transformer相当或更好的结果，并且延迟低。

作者还提到与小核cnn相比，大核cnn具有更大的有效接受野和更高的形状偏差而不是纹理偏差。RepLKNet的高性能主要是因为通过大内核构建的大感受野。

使用大核卷积的经验准则：

(1) 非常大的核心任然是高效的；

（2）残差连接(identity shortcut)方式对大核网络尤其重要。

（3）用小核重新参数化有助于弥补优化问题。

（4）在ImageNet中，大卷积对下游任务促进作用更大；

（5）大内核即使在小的特征映射上也是有用的。

RepLKNet的相关技术：

结构重新参数化是一种通过转换参数来等效转换模型结构的方法。

RepLKNet的网络结构：

RepLKNet是纯CNN模型，网络总体上遵循Swin Transformer的宏架构。使用大深度卷积取代了多头子注意力。

根据上图，Stem指的是开始层，Stem层的目的是再开始时通过几个Conv层捕获更多的细节。步长为2的2倍下采样的3x3卷积层；深度可分离(DW:每个通道都有一个独立的卷积核)的3x3卷积层；一个1x1Conv;另一个步长为2的2倍下采样DW3x3卷积；

每个阶段都包含几个RepLK Block: 在每个DW大核卷积前后使用一个1x1卷积（每个大核卷积都使用5x5卷积进行重新参数化）。使用1x1卷积层是为了增加模型的深度，从而提供更多的非线性和跨通道的信息通信。此模块后面连接一个ConvFFN;

Step之间放置了Transition Blocks：先通过1x1卷积增加通道尺寸；然后连接一个步长为2的2倍下采样DW3x3卷积；

总之，每个阶段具有三个架构超参数：RepLK块的数量B、通道尺寸C和内核大小K。因此RepLKNet架构由[B1; B2; B3; B4]、[C1; C2; C3; C4]、[K1; K2; K3; K4]定义。

关注

9
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs（关于大核卷积的论文笔记）

作者提出了一个提出了RepLKNet，一个纯CNN架构，其内核大小为31×31，而不是常用的3×3。此模型再一些经典的下游任务上获得了与Swin Transformer相当或更好的结果，并且延迟低。作者还提到与小核cnn相比，大核cnn具有更大的有效接受野和更高的形状偏差而不是纹理偏差。RepLKNet的高性能主要是因为通过大内核构建的大感受野。
复制链接

扫一扫

errorwarn CSDN认证博客专家 CSDN认证企业博客

码龄4年

14: 原创

138万+: 周排名

8万+: 总排名

1万+: 访问

: 等级

348: 积分

111: 粉丝

192: 获赞

9: 评论

161: 收藏

私信

关注

热门文章

分类专栏

个人笔记 1篇

最新评论

《Bilateral Knowledge Interaction Network for Referring Image Segmentation》论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《Improving Referring Image Segmentation usingVision-Aware Text Features》论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
《Area-keywords cross-modal alignment for referring image segmentation》“区域-关键字”跨模态对齐框架
CSDN-Ada助手: 恭喜作者发布了《Area-keywords cross-modal alignment for referring image segmentation》这篇博客，探讨了“区域-关键字”跨模态对齐框架的相关内容，内容十分有深度和启发性。希望作者能够继续保持创作的热情和努力，不断探索前沿领域的研究，为学术界带来更多的创新思路和成果。建议在下一步的创作中，可以结合实际案例或者应用场景，更好地展示框架的有效性和实用性，让读者能够更直观地理解和应用您的研究成果。期待您更多的精彩作品！
Referring Image Segmentation Using Text Supervision（论文笔记）
im just me: 你好，想请教一下您，为什么在有了正样本的相应图后，还要对其他负样本的响应图一起去进行一个最佳响应图选择呢？最好的响应图不就是在对正样本的响应吗？
什么是alpha mattes（阿尔法通道图层）
CSDN-Ada助手: 恭喜你写了第12篇博客！阿尔法通道图层的介绍很详细，让我对它有了更深入的了解。希望你能继续分享更多关于图像处理的知识，或许可以考虑介绍一些实际应用案例，或者深入分析一些相关技术的发展趋势。期待你的下一篇文章！祝你创作顺利！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。