VGG-大规模图像识别的深度卷积神经网络
一、研究背景、成果及意义
1、学习目标
这篇文章是针对卷积神经网络的深度去研究的,并且是针对大规模的图像识别任务中。
2、研究背景、成果及意义
相关研究
1、AlexNet:ILSVRC-2012分类冠军,里程牌的CNN模型
AlexNet卷积神经网络设计理念会一直沿用,前面卷积池化进行特征提取,后面FC层分类的设计思想。
2、ZFNet:ILSVRC-2013分类冠军,对AlexNet改进
仅仅是对AlexNet超参数的改变
3、OverFeat:ILSVRC-2013定位冠军,集分类、定位和检测于一体的卷积网络方法
利用全卷积网络FCN将分类、定位和检测集于一体,在本文VGG测试技巧中的Dense稠密测试就需要用到这一概念。
1、AlexNet:卷积神经网络设计的范式,里程碑式的CNN模型,其“前特征提取后分类输出”的思想沿用至今
2、ZFNet:ZFNet模型只是对AlexNet进行了超参数的改变,并未提出一种广泛使用的tricks
3、OverFeat:OverFeat模型提出全卷积形式对图片进行预测
更正:2 * 2输出神经元对应到14 * 14中蓝色区域
相关研究对于VGG的启示
1、AlexNet:借鉴卷积模型结构;
2、ZFNet:借鉴其采用小卷积核思想;11 * 11(AlexNet)→7 * 7(ZFNet)→3 * 3(VGG)
3、OverFeat:借鉴全卷积,实现高效的稠密(Dense)测试;
4、NIN:尝试1 * 1卷积;VGG做了尝试,借鉴NIN利用1 * 1卷积
研究成果
VGG获得ILSVRC-2014中定位第1名,分类第2名的成绩
研究意义
1、开启小卷积核时代:33卷积核成为主流模型;
现在几乎看不到55或77卷积,33卷积就是从VGG模型中衍生而来的
2、作为各类图像任务的骨干网络结构:分类、定位、检测、分割一系列图像任务大都有VGG为骨干网络的尝试
采用VGG的意义:
①VGG简洁,不像GoogleNet中inception设计有太多的分支,卷积+池化+全连接层输出;
②VGG性能好,在众多任务中都有夺冠。
二、论文摘要及图表
摘要核心(Abstract)