VGG-16 笔记

最新推荐文章于 2025-03-31 11:19:25 发布

叫什么就是什么

最新推荐文章于 2025-03-31 11:19:25 发布

阅读量8.9k

点赞数 2

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_24548569/article/details/82529211

版权

VGG-16是《Very Deep Convolutional Networks for Large-scale Image Recognition》中提出的经典深度学习模型，其特点是16层深度，使用3×3的卷积核。网络由13个卷积层和3个全连接层组成，通过5个max-pooling层实现特征提取。作者未使用LRN，且在max-pooling后feature map的channel会翻倍。在测试阶段，全连接层被转化为卷积层，允许对任意大小的输入进行处理。此外，多GPU训练策略用于加速模型训练。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

VGG-16

Karen Simonyan 在《Very Deep Convolutional Networks for Large-scale Image Recognition》中讨论了卷积网络的深度对其在大规模图像识别的准确性的影响。作者比较了5中不同深度的卷积网络，其中深度为16的网络——VGG-16成为一种经典的网络架构。许多网络都是在VGG-16的基础上删除和添加其他层。

VGG-16 Architecture

这里只介绍VGG-16的架构，这是用的最多的一种网络，论文中的其它4个就不介绍了。
VGG-16 Architecture

VGG-16的网络很简单，有13个卷积层（被5个max-pooling层分割）和3个全连接层。所有卷积层的过滤器大小都是 $3 \times 3$ ，步长为1，进行padding。作者设置所有卷积层的过滤器大小都为 $3 \times 3$ 是有原因的，因为过滤器尺度更大的卷积层可以使用多个 $3 \times 3$ 卷积层来达到同样的效果，比如2个连在一起的 $3 \times 3$ 卷积层（步长为1）的接收域与 $5 \times 5$ 的卷积层的接收域一样。作者还给出了更多的解释，首先，使用多个

最低0.47元/天解锁文章