深度学习之VGG19模型简介

最新推荐文章于 2025-03-21 11:52:28 发布

_李小白

最新推荐文章于 2025-03-21 11:52:28 发布

阅读量1.1w

点赞数 7

文章标签：卷积网络神经网络深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012739527/article/details/124012095

版权

VGG由Oxford的VisualGeometryGroup提出,主要工作是证明增加网络深度能提升性能。VGG有VGG16和VGG19两种结构，采用3x3卷积核替代大卷积核，通过增加网络深度来学习更复杂模式。VGG16包含16个隐藏层，VGG19包含19个隐藏层。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

image.png

什么是VGG

VGG是Oxford的Visual Geometry Group的组提出的。

该网络是在ILSVRC 2014上的相关工作，主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能。

VGG有两种结构，分别是VGG16和VGG19，两者并没有本质上的区别，只是网络深度不一样。

VGG原理

VGG16相比AlexNet的一个改进是采用连续的几个3x3的卷积核代替AlexNet中的较大卷积核(11x11，7x7，5x5)。

对于给定的感受野(与输出有关的输入图片的局部大小)，采用堆积的小卷积核是优于采用大的卷积核，因为多层非线性层可以增加网络深度来保证学习更复杂的模式，而且代价还比较小(参数更少)。

简单来说，在VGG中，使用了3个3x3卷积核来代替7x7卷积核，使用了2个3x3卷积核来代替5*5卷积核，这样做的主要目的是在保证具有相同感知野的条件下，提升了网络的深度，在一定程度上提升了神经网络的效果。

比如，3个步长为1的3x3卷积核的一层层叠加作用可看成一个大小为7的感受野(其实就表示3个3x3连续卷积相当于一个7x7卷积)，其参数总量为 3x(9xC^2) ，如果直接使用7x7卷积核，其参数总量为 49xC^2 ，这里 C 指的是输入和输出的通道数。很明显，27xC2小于49xC2，即减少了参数；而且3x3卷积核有利于更好地保持图像性质。

这里解释一下为什么使用2个3x3卷积核可以来代替55卷积核：

5x5卷积看做一个小的全连接网络在5x5区域滑动，我们可以先用一个3x3的卷积滤波器卷积，然后再用一个全连接层连接这个3x3卷积输出，这个全连接层我们也可以看做一个3x3卷积层。这样我们就可以用两个3x3卷积级联(叠加)起来代替一个 5x5卷积。

VGG网络结构

image.png

含义：
1.conv表示卷积层
2.FC表示全连接层
3.conv3表示卷积层使用3x3 filters
4.conv3-64表示深度64
5.maxpool表示最大池化

VGG16包含了16个隐藏层(13个卷积层和3个全连接层)，如上图中的D列所示
VGG19包含了19个隐藏层(16个卷积层和3个全连接层)，如上图中的E列所示

VGG优缺点

VGG优点:1.VGGNet的结构非常简洁，整个网络都使用了同样大小的卷积核尺寸(3x3)和最大池化尺寸(2x2)。2.几个小滤波器(3x3)卷积层的组合比一个大滤波器(5x5或7x7)卷积层好：验证了通过不断加深网络结构可以提升性能。

VGG缺点:1.VGG耗费更多计算资源，并且使用了更多的参数(这里不是3x3卷积的锅)，导致更多的内存占用(140M)。

其中绝大多数的参数都是来自于第一个全连接层。VGG可是有3个全连接层！

参考

VGG16和VGG19介绍 VGG卷积神经网络模型解析

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

_李小白 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。