no.13 ConvNet

最新推荐文章于 2023-10-17 13:54:26 发布

送自己一朵小红花

最新推荐文章于 2023-10-17 13:54:26 发布

阅读量215

点赞数

文章标签：深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44581312/article/details/129763664

版权

随着transformer在cv领域大放异彩，原始的卷积网络到瓶颈了吗？

然后我们根据transformer的网络架构，是否能得到一些网络搭建的启发呢？

比如根据transformer去巧妙的调整网络架构，比如使用LN代替BN，减少relu函数，调整卷积和下

采样的数量和位置，调整block的分配，结果真的实现了在相同参数下，训练结果好于transformer

的一种新的网络模型。而且代码才200行就能实现目标网络的构建。

（1）首先作者以resnet-50模型为基础模型

（2）让resnet网络中堆叠的block比列，借鉴transformer模型中的比例，准确率得到提升

ResNetconv4_xstage3ResNet50stage1stage4(3, 4, 6, 3)1:1:2:1

Swin Transformer

Swin-T1:1:3:1

Swin-L1:1:9:1

Swin Transformerstage3ResNet50(3, 4, 6, 3)(3, 3, 9, 3)Swin-T78.8%79.4%

（3）在之前的卷积神经网络中，一般最初的下采样模块一般都是通过一个卷积核大小为步距为2的卷积层+步距为2的最大池化下采样共同组成，高和宽都下采样4倍。但在模型中一般都是通过一个卷积核非常大且相邻窗口之间没有重叠的（即等于）卷积层进行下采样。比如在中采用的是一个卷积核大小为步距为4的卷积层构成，同样是下采样4倍。

（4）借鉴了组卷积

（5）两头粗中间细的瓶颈结构（resnet），转成两头细中间粗的。对较大模型的accy是比较明显的

（6）先通过DW卷积（有点类似attention模块），再通过普通卷积，即将dw模块上移，因为在transformer模块当中，attention模块在mlp模块前面，结果效果又提升了

（7）改变卷积核的内核大小，3x3-->7x7,作者试过多种，7x7最好，而神奇的事情，它竟然和swim中的窗口大小是一样的

（8）采用更少的激活函数，原先的卷积网络中我们习惯在卷积后面加上relu，但是transformer中很少，结果效果提升了，当然把relu换成了transformer 中的gelu激活，但是效果没有更明显。

（9）使用更少的norm操作，提升了1个点

（10）BN->LN又提升了一个点，都是借鉴transformer中的模型架构

（11）在transformer中，它是通过patch merging中进行下采样的，所以作者单独使用了一个下采样，而不是在block中卷积stride=2下采样

不同的convnet版本：

ConvNeXt-T： C = （96， 192， 384， 768）， B = （3， 3， 9， 3）

ConvNeXt-S： C = （96， 192， 384， 768）， B = （3， 3， 27， 3）

ConvNeXt-B： C = （128， 256， 512， 1024）， B = （3， 3， 27， 3）

ConvNeXt-L： C = （192， 384， 768， 1536）， B = （3， 3， 27， 3）

ConvNeXt-XL： C = （256， 512， 1024， 2048）， B = （3， 3， 27， 3）

Convnet网络block与transformer与resnet对比，或者说是改进借鉴对比

Convnet网络模型。

送自己一朵小红花

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
no.13 ConvNet

（3）在之前的卷积神经网络中，一般最初的下采样模块一般都是通过一个卷积核大小为步距为2的卷积层+步距为2的最大池化下采样共同组成，高和宽都下采样4倍。（8）采用更少的激活函数，原先的卷积网络中我们习惯在卷积后面加上relu，但是transformer中很少，结果效果提升了，当然把relu换成了transformer 中的gelu激活，但是效果没有更明显。（7）改变卷积核的内核大小，3x3-->7x7,作者试过多种，7x7最好，而神奇的事情，它竟然和swim中的窗口大小是一样的。的一种新的网络模型。
复制链接

扫一扫

送自己一朵小红花 CSDN认证博客专家 CSDN认证企业博客

码龄5年

29: 原创

125万+: 周排名

13万+: 总排名

7654: 访问

: 等级

415: 积分

82: 粉丝

115: 获赞

3: 评论

97: 收藏

私信

关注

热门文章

分类专栏

目标检测 1篇
图像分类 10篇

最新评论

第二次作业，换源export
CSDN-Ada助手: 恭喜您完成了第19篇博客！标题中的“换源export”让我对内容产生了浓厚的兴趣。您的持续创作值得赞扬，这不仅展示了您的坚持和努力，也让读者们从中获益良多。在下一步的创作中，或许您可以考虑更深入地探讨“换源export”的相关主题，比如具体介绍一些常用的数据源，并分享您在使用过程中的经验和技巧。此外，您也可以结合实际案例，展示如何有效地运用“换源export”来解决问题或优化业务。这样的创作方式将更加引人入胜，并能够帮助读者们更好地理解和应用这一概念。再次恭喜您，并期待您未来更多的精彩博文！继续保持创作的热情和努力，您一定会取得更大的成功。
第二次课程笔记
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题中的“第二次课程笔记”让我感到您在学习过程中取得了长足的进步。您的坚持和努力令人钦佩，也让读者受益匪浅。接下来，我想建议您在下一篇博客中尝试探索一些与课程内容相关的实例或案例，这将有助于更深入地理解和应用所学知识。期待阅读您未来的创作！
LLM介绍
CSDN-Ada助手: 恭喜您写下第18篇博客！标题为“LLM介绍”真是引人注目。您对LLM的介绍给读者们带来了很多有价值的信息，很高兴看到您在这一领域上的深入研究与分享。同时，我也想提供一些建议，希望能够为您的下一步创作提供一些灵感。或许您可以考虑从LLM的应用领域、与其他相关领域的交叉研究等方面进行更深入的探索，这将进一步丰富您的博客内容。感谢您的努力，期待你未来更多的精彩文章！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。