为什么用2个串联的3x3卷积可以代替1个5x5的卷积

最新推荐文章于 2025-04-11 18:34:15 发布

ChAn_ZJUT

最新推荐文章于 2025-04-11 18:34:15 发布

阅读量6.1k

点赞数 9

文章标签：深度学习神经网络 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Chanvivi/article/details/120665438

版权

本文探讨了深度网络中使用3x3卷积核替代大尺寸卷积核的趋势，旨在减少参数量并保持相同感受野。通过实例比较，展示了2个3x3卷积如何等效于1个5x5卷积，并说明这种做法能有效减少约30%的参数，同时增加网络深度，提升模型效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在深度网络的发展趋势中，提升网络的宽度和深度已经是常规操作，能够解决过拟合，但同时也带来了大量参数的问题，所以减少网络参数也是必要的。在很多网络中，都使用了3个3x3卷积核来代替7x7卷积核，或者使用了2个3x3卷积核来代替5x5卷积核，这样做的主要目的是：（1）在保证具有相同感受野Receptive Field的条件下，增加网络的深度，进而在一定程度上提升神经网络的效果；（2）减少网络的计算参数量。

①以2个3x3卷积对于5x5卷积具有相同感受野为例，

假设图片尺寸为28x28，

首先，使用5x5卷积核对其进行卷积，且stride=1，得到特征图尺寸为:(28-5)/1+1=24。

然后，使用2个3x3卷积核（这里的两个是指2层），stride=1，有：

第一层3x3：得到的结果是(28-3)/1+1=26

第二层3x3：得到的结果是(26-3)/1+1=24

所以，2个3x3卷积后的最终结果和1个5x5的卷积核是一样的。

②说明一下减少网络参数的作用。

对于2个3x3卷积核，所用的参数总量为2x(3x3)xchannels, 对于1个5x5卷积核为5x5xchannels, 因此可以显著地减少参数的数量，可以减少约30%的参数数量。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。