深度学习之基础模型-VGG

本文详细介绍了VGG网络的基础结构和模型框架,探讨了3x3卷积替代7x7卷积的原因,以及1x1卷积的作用。VGG网络在ILSVRC等任务中取得了优秀的精度,同时强调了网络深度对结果的重要性。文章还讨论了不同尺度的预测方法,如多尺度裁剪和模型融合,展示了它们对模型性能的影响。
摘要由CSDN通过智能技术生成

VGG论文给出了一个非常振奋人心的结论:卷积神经网络的深度增加和小卷积核的使用对网络的最终分类识别效果有很大的作用。记得在AlexNet论文中,也做了最后指出了网络深度的对最终的分类结果有很大的作用。这篇论文则更加直接的论证了这一结论。

作者Karen Simonyan & Andrew Zisserman来自Visual Geometry Group, Department of Engineering Science, University of Oxford

网络结构

这里写图片描述
[图片来源]

论文指出:

  • VGG不仅在ILSVRC的分类和检测任务中取得了the state-of-the-art的精度
  • 在其他数据集上也具有很好的推广能力
结构Architecture
名称 说明
输入图像大小 224x224
预处理 减去均值
卷积核 3x3,1x1
padding 1 for 3x3
Max-pooling 2x2 s-2
激活函数 ReLU

说明:

    *1x1卷积核:降维,增加非线性性
    *3x3卷积核:多个卷积核叠加,增加空间感受野,减少参数

论文中,作者指出,虽然LRN(Local Response Normalisation)在AlexNet对最终结果起到了作用,但在VGG网络中没有效果,并且该操作会增加内存和计算,从而作者在更深的网络结构中,没有使用该操作。

VGG网络结构
这里写图片描述

VGG网络参数
这里写图片描述

Q1: 为什么3个3x3的卷积可以代替7x7的卷积?

  • 3个3x3的卷积,使用了3个非线性激活函数,增加了非线性表达能力,使得分割平面更具有可分性
  • 减少参数个数。对于C个通道的卷积核,7x7含有参数 72C2 , 3个3x3的参数个数为 332C
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值