VGG 网络结构详解与复现

最新推荐文章于 2024-08-01 01:57:13 发布

RaphaelCA

最新推荐文章于 2024-08-01 01:57:13 发布

阅读量1.2k

点赞数

分类专栏：网络复现笔记文章标签：卷积神经网络神经网络机器学习 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chemcello/article/details/118465125

版权

本文详细介绍了VGG网络结构，探讨了连续小卷积核替代大卷积核的优势，并提供了VGG网络在CIFAR10数据集上的复现过程，包括关键代码和解决梯度消失问题的策略。

摘要由CSDN通过智能技术生成

VGG 网络结构详解与复现

部分参考了Amusi的知乎ZHUAN专栏文章《一文读懂VGG网络》

前言

VGG = Visual Geometry Group, 是Oxford的同名视觉组提出的深度网络。论文中提出了VGG-11, VGG-13, VGG-16, VGG-19等网络。其中全连接层数量都为3层。

VGG 相比于AlexNet的一个重要改进是用连续的3x3卷积代替了AlexNet中较大的卷积核。

使得多次小规模卷积（e.g. 三次 3 x 3 卷积）之后得到特征图具有与单次大规模卷积（e.g. 一次 7 x 7卷积）相同的感受野。对于给定的感受野，采用堆积小卷积核的方式增加了非线性层的数量，使得神经网络能够学到更复杂的模式，同时付出更小的计算代价（参数量更少）

参数量计算：

对于一个三通道输入：
- 7 x 7 卷积，共使用n组卷积核: $\times 7 \times n = 49n$
- 3个3 x 3 卷积进行堆叠，共使用n组卷积核： $\times 3 \times 3 \times n = 27n$

什么是感受野？

感受野是CNN中的一个重要概念（同时也是基础中的基础）。所谓感受野即是卷积层输出的特征图上的某一个像素在输入图片上对应的区域。

我们来回顾一下感受野大小的计算公式：
$r_l = r_{l-1} + (k_l - 1) \times \prod_{i=0}^{l-1}s_i$

最低0.47元/天解锁文章

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
VGG 网络结构详解与复现

VGG 网络结构详解与复现部分参考了Amusi的知乎ZHUAN专栏文章《一文读懂VGG网络》前言VGG = Visual Geometry Group, 是Oxford的同名视觉组提出的深度网络。论文中提出了VGG-11, VGG-13, VGG-16, VGG-19等网络。其中全连接层数量都为3层。VGG 相比于AlexNet的一个重要改进是用连续的3x3卷积代替了AlexNet中较大的卷积核。使得多次小规模卷积（e.g. 三次 3 x 3 卷积）之后得到特征图具有与单次大规模卷积（e.g. 一
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。