VGG网络结构详解

参考论文:Very Deep Convolutional Networks for Large-Scale Image Recognition

结构组成

论文中提供的6种网络配置:
在这里插入图片描述
整个网络有5个vgg-block块和5个maxpool层逐个相连,然后进入FC层,直到最后1000个softmax输出。多种VGG网络设计都很统一,都有相同的224×224×3的input层+5个maxpool层+3层fc全连接层,区别在于中间的Vgg-block块的设计不同。

以上图D列的vgg16为例:

input:

224×224×3 三通道(RGB)的图像;

vgg-block:

输入224×224×3,经过64个filter(kernelsize=(3,3,3)),stride = 1,padding=same后,得224×224×64;

Max-pooling:

输入224×224×64,经过pool size=2,stride=2后,得112×112×64;

vgg-block:

输入112×112×64,经128个filter(kernelsize=(3,3,64)),得到112×112×128;

Max-pooling:

输入112×112×128,经pool size = 2,stride = 2后,得56×56×128;

vgg-block

输入56×56×128,经过256个filter(kernelsize=(3,3,128))后,得56×56×256;

Max-pooling

输入56×56×256,经pool size = 2,stride = 2后,得28×28×256;

vgg-block:

输入28×28×256,经过512个filter(kernelsize=(3,3,256))后,得28×28×512;

Max-pooling

输入28×28×512,经pool size = 2,stride = 2后,得14×14×512;

vgg-block:

输入14×14×256,经过512个filter(kernelsize=(3,3,512))后,得14×14×512;

Max-pooling

输入14×14×512,经pool size = 2,stride = 2后,得7×7×512,展平(Flattern)得25088个参数;

Dense

输入(25088,),经过4096个神经元,得(4096,);

Dense

输入(4096,),经过4096个神经元,得(4096,);

Dense

输入(4096,),经过1000个神经元,得(1000,)。

其中前两层全连接层在使用relu后还使用了Dropout(rate=0.5)对神经元随机失活,最后一层全连接层用softmax输出1000个分类。

特点

论文提出,通过堆叠2个 3*3 的卷积核来代替 5*5 的卷积核;堆叠3个 3*3 的卷积核来代替 7*7 的卷积核。虽然用了小的卷积核来替换大的卷积核,但并不会影响感受野,即感受野是相同的,但减少了参数。
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王菜菜丫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值