CNN感受野和VGG16

最新推荐文章于 2024-08-18 22:00:00 发布

lyqstar...

最新推荐文章于 2024-08-18 22:00:00 发布

阅读量911

点赞数

文章标签： cnn 神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44868313/article/details/122363894

版权

CNN 感受野 VGG16 卷积核参数计算

关键词由CSDN通过智能技术生成

CNN感受野、VGG16

文章导航

- CNN感受野、VGG16

1.CNN感受野

在卷积神经网络中，决定某一层输出结果中一个元素所对应的输入层的区域大小，被称作感受野（receptive filed）。简单地说就是输出feature maps上的一个单元对应于输入层上的区域大小。

卷积的计算公式如下：
$Output_{size} = \lfloor(Input_{size} - Kernel_{size} + 2*Padding)/stride\rfloor + 1$
下面以一个输入为9*9的例子简单说明，如下图：

感受野的计算公式为： $$ F(i) = (F(i+1) - 1) * stride + Ksize $$ 其中：

F(i)为第i层的感受野；
Ksize为卷积核或池化核的尺寸；
stride为第i层的步距；

则结合感受野的计算公式来计算上述中的例子：

Feature map: F = 1

Pool1: F = (1 - 1) * 2 + 2 = 2

Conv1: F = (2 - 1) * 2 + 3 = 5

vgg论文中提到，可以通过堆叠两个3x3的卷积核替代5x5的卷积核，堆叠三个3x3的卷积核替代7x7的卷积核。

Feature map: F = 1

Conv3x3(3): F = (1 - 1) * 1 + 3 = 3

Conv3x3(2): F = (3 - 1) * 1 + 3 = 5 (两个3x3的卷积核替代5*5的卷积核)

Conv3x3(1): F = (5 - 1) * 1 + 3 = 7 （三个3x3的卷积核替代7x7的卷积核）

使用7x7卷积核所需要的参数，与堆叠三个3x3的卷积核所需要的参数（假设输入和输出channel都为C）
$\times 7\times C \times C = 49C^{2} \\ 3 \times 3\times C \times C + 3 \times 3\times C \times C + 3 \times 3\times C \times C = 27C^{2}$

2.VGG16

其实vgg系列包含vgg11、13、16、19，这里我们以常用的vgg16作为例子。

vgg16比较规整，不计算后面的全连接层可以分为5个stage, 每个stage的feature maps都会高宽减半，而通道数都会增加一倍（注意到512时就不会再增加一倍了），可以看出，经过5个stage之后，输出的feature maps的宽高为输出图像的1/32。

注意：为什么下图中的ConvNet Configration中的D命名为vgg16呢？

因为前5个stage有13个卷积层，之后又3个全连接层，因此为16层。（注意：像maxpool没有权重的层是不计算在内的）

另外：

卷积层(conv)的stride为1，padding为1
池化层(maxpool)的size为2， stride也为2

（下面计算参数的图片来源于FeiFei Li在CS231的课件）
在这里插入图片描述
上图给出了整个网络的全部参数的计算过程（不考虑偏置）
图中红色是计算所需存储容量的部分，蓝色是计算权重参数数量的部分。

3.vgg16代码

vgg16代码可以参考：https://github.com/WZMIAOMIAO/deep-learning-for-image-processing/tree/master/pytorch_classification/Test3_vggnet

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。