快速理解VGG网络

最新推荐文章于 2024-04-22 14:21:06 发布

YLTENG

最新推荐文章于 2024-04-22 14:21:06 发布

阅读量2.6w

点赞数 21

文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_44957722/article/details/119089221

版权

快速理解VGG网络

简介
一些有用的链接
网络结构
VGG的特点
数据增强方面
Layer层的设计（VGG16）
参数

简介

VGGNet 是牛津大学计算机视觉组（Visual Geometry Group）和谷歌 DeepMind 一起研究出来的深度卷积神经网络，因而冠名为 VGG。VGG是一种被广泛使用的卷积神经网络结构，其在在2014年的 ImageNet 大规模视觉识别挑战(ILSVRC -2014)中获得了亚军，不是VGG不够强，而是对手太强，因为当年获得冠军的是GoogLeNet。

通常人们说的VGG是指VGG-16(13层卷积层+ 3层全连接层)。虽然其屈居亚军，但是由于其规律的设计、简洁可堆叠的卷积块，且在其他数据集上都有着很好的表现，从而被人们广泛使用，从这点上还是超过了GoogLenet。 VGG和之前的AlexNet相比，深度更深，参数更多(1.38亿)，效果和可移植性更好。

一些有用的链接

文章地址：https://arxiv.org/abs/1409.1556

网络结构

VGGNet以下6种不同结构，我们以通常所说的VGG-16(即下图D列)为例，展示其结构示意图
VGG

那么对于VGG16 来讲他的网络结构款加图就应该是下面这样的：
VGG16
可见，整个网络有5个vgg-block块和5个maxpool层逐个相连，然后进入FC层，直到最后1000路softmax输出。

VGG的特点

vgg-block内的卷积层都是同结构的
池化层都得上一层的卷积层特征缩减一半
深度较深，参数量够大
较小的filter size/kernel size

1.vgg-block内的卷积层都是同结构的。意味着输入和输出的尺寸一样，且卷积层可以堆叠复用，其中的实现是通过统一的size为3×3的kernel size + stride1 + padding(same)实现。下面来看一下VGG16中其中一个单元的示意图：这个就是VGG-16中的一个vgg-block块
VGG-16中的一个vgg-block块

2.maxpool层将前一层(vgg-block层)的特征缩减一半使得尺寸缩减的很规整，从224-112-56-28-14-7。其中是通过pool size2 + stride2实现
3.深度较深，参数量够大较深的网络层数使得训练得到的模型分类效果优秀，但是较大的参数对训练和模型保存提出了更大的资源要求。
4.较小的filter size/kernel size，这里全局的kernel size都为3×3，相比以前的网络模型来说，尺寸足够小。

数据增强方面

VGG网络中，数据增强使用的是Multi-Scale。
这里的Multi-Scale主要是将图像放大到随机的大小，然后再裁剪到224*224 的图像。

Layer层的设计（VGG16）

多种VGG网络设计都很统一，都有相同的224×224×3的input+5个maxpool层+3层fc全连接层，区别在于中间的Vgg-block块的设计不同。下面我们以D列中的VGG-16为例展示具体的layer设计：block和block之间通过maxpool的stride=2,pool size=2进行减半池化；block内部，为了保持卷积层间的shape一致，kernel size统一尺寸为3×3。

第1层输入层：输入为224×224×3 三通道的图像。

第2层vgg block层：输入为224×224×3，经过64个kernel size为3×3×3的filter,stride = 1，padding=same卷积后得到shape为224×224×64的block层&#

最低0.47元/天解锁文章

YLTENG

关注

21
点赞
踩
138

收藏

觉得还不错? 一键收藏
1
评论
快速理解VGG网络

快速理解VGG网络简介一些有用的链接网络结构VGG的特点数据增强方面Layer层的设计（VGG16）参数简介VGGNet 是牛津大学计算机视觉组（Visual Geometry Group）和谷歌 DeepMind 一起研究出来的深度卷积神经网络，因而冠名为 VGG。VGG是一种被广泛使用的卷积神经网络结构，其在在2014年的 ImageNet 大规模视觉识别挑战(ILSVRC -2014)中获得了亚军，不是VGG不够强，而是对手太强，因为当年获得冠军的是GoogLeNet。通常人们说的VGG是指V
复制链接

扫一扫