计算机视觉经典论文阅读系列1--VGG

VGG论文探讨了深度对卷积神经网络(CNN)在图像识别准确性上的作用,通过使用小尺寸3×3卷积核增加网络深度,达到16-19层,在2014ImageNet竞赛中取得优异成绩。尽管更深的网络在一定程度上提高了性能,但错误率会饱和,表明并非无限增加深度就能持续提升效果。局部归一化和1×1卷积核的应用也进行了探索,最终,通过集成不同架构,VGG模型实现了高分类准确率。
摘要由CSDN通过智能技术生成

计算机视觉经典论文-CNN

经典论文的框架听完相关的课程,还是记不住/(ㄒoㄒ)/~~
从论文入手,重新整理一遍
争取保证1周一篇,3月底之前完成
在这里插入图片描述
VGG:《Very Deep Convolutional Networks for Large-Scale Image Recognition》
作者:VGG(作者所在的牛津大学视觉几何组Visual Geometry Group的缩写)

背景介绍
  • 重点研究了卷积网络深度对图像识别准确性的影响
  • 主要贡献:应用3×3卷积增加网络深度,将网络深度提升至16-19层,在2024 Imagenet分类和检测比赛中分别获得第二名和第一名。
模型特点
  • 仅应用3×3卷积核
  • 两个3×3卷积(stride=2)具有5×5的有效感受野;三个3×3卷积(stride=2)具有7×7的有效感受野
    参数比较3×(3×3×C×C)->7×7×C×C,后者比前者参数量多81%
  • 应用3个FC层,使决策函数更具辨识性
网络架构在这里插入图片描述
图像分类

在这里插入图片描述

  1. A-LRN为加入局部归一化的网络架构,并未使得模型效果变好
  2. 分类误差随着模型深度的增加而减少
  3. 架构C中(包含1×1卷积核)的性能比同样深度的D性能差
  4. 网络深度达到19层(E)时,架构的错误率饱和,更深入的模型对更大的数据集有益

在这里插入图片描述
测试时对图像尺寸的调整使得模型达到了更好的效果
在这里插入图片描述
应用两个架构的集成模型达到了比赛的最优效果,最终分类准确率仅次于GoogLeNet

结论

深度在视觉任务中具有重要性,有利于提高分类精度

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值