【深度学习CV-baseline】VGG论文精读

VGG-大规模图像识别的深度卷积神经网络
一、研究背景、成果及意义
1、学习目标

这篇文章是针对卷积神经网络的深度去研究的,并且是针对大规模的图像识别任务中。
在这里插入图片描述
2、研究背景、成果及意义
在这里插入图片描述
相关研究
1、AlexNet:ILSVRC-2012分类冠军,里程牌的CNN模型
AlexNet卷积神经网络设计理念会一直沿用,前面卷积池化进行特征提取,后面FC层分类的设计思想。
2、ZFNet:ILSVRC-2013分类冠军,对AlexNet改进
仅仅是对AlexNet超参数的改变
3、OverFeat:ILSVRC-2013定位冠军,集分类、定位和检测于一体的卷积网络方法
利用全卷积网络FCN将分类、定位和检测集于一体,在本文VGG测试技巧中的Dense稠密测试就需要用到这一概念。

1、AlexNet:卷积神经网络设计的范式,里程碑式的CNN模型,其“前特征提取后分类输出”的思想沿用至今
在这里插入图片描述
2、ZFNet:ZFNet模型只是对AlexNet进行了超参数的改变,并未提出一种广泛使用的tricks
在这里插入图片描述
3、OverFeat:OverFeat模型提出全卷积形式对图片进行预测
在这里插入图片描述
在这里插入图片描述
更正:2 * 2输出神经元对应到14 * 14中蓝色区域

相关研究对于VGG的启示
1、AlexNet:借鉴卷积模型结构;
2、ZFNet:借鉴其采用小卷积核思想;11 * 11(AlexNet)→7 * 7(ZFNet)→3 * 3(VGG)
3、OverFeat:借鉴全卷积,实现高效的稠密(Dense)测试;
4、NIN:尝试1 * 1卷积;VGG做了尝试,借鉴NIN利用1 * 1卷积

研究成果
VGG获得ILSVRC-2014中定位第1名,分类第2名的成绩

研究意义
1、开启小卷积核时代:33卷积核成为主流模型;
现在几乎看不到5
5或77卷积,33卷积就是从VGG模型中衍生而来的
2、作为各类图像任务的骨干网络结构:分类、定位、检测、分割一系列图像任务大都有VGG为骨干网络的尝试
采用VGG的意义:
①VGG简洁,不像GoogleNet中inception设计有太多的分支,卷积+池化+全连接层输出;
②VGG性能好,在众多任务中都有夺冠。

在这里插入图片描述
二、论文摘要及图表
摘要核心(Abstract)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

又青。

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值