盏茶论文CV篇(二) Very Deep Convolutional Networks for Large-Scale Image Recognition

盏茶y

于 2020-02-23 01:07:33 发布

阅读量203

点赞数

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/XD_Cauthy/article/details/104452317

版权

计算机视觉专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文研究了在大规模图片识别中，卷积神经网络的深度对准确率（accuracy）的影响。我们的主要贡献是通过非常小的3x3卷积核的神经网络架构全面评估了增加深度对网络的影响，结果表明16-19层的网络可以使现有设置的网络性能得到显著提高。这项发现是我们在2014年的ImageNet比赛中提交方案的基础，我们的团队分别在定位和分类中获得了第一和第二的成绩。我们还证明了此模型可以泛化到其他数据集上，并达到当前最佳水平。我们已经公布了两个性能最佳的卷积神经网络模型，以便深度视觉在计算机视觉中的进一步研究。

正文介绍

网络架构

VGG文章中共列出了6种VGG的变种网络，网络架构如下，
在这里插入图片描述

感受野

感受野（Receptive Field）的定义是卷积神经网络每一层输出的特征图上的像素点在输入图片上映射的区域大小，即特征图上的一个点跟原图上有关系的点的区域
感受野计算公式：
感受野大小 = 上一层感受野大小 + （本层卷积核尺寸 - 1）（卷积步幅大小的累乘）
举例：一个55的卷积核感受野的大小与两个3*3的卷积核感受野相同

为什么使用3*3的卷积核

1.深度更深并增加了非线性
3个33的卷积核感受野与1个77卷积核感受野等效，但是3个33卷积之间加入了激活函数，与仅使用1个77卷积核相比，深度更深且增加了非线性
2.参数量更少
假设输入通道大小为C，3个C通道的33的卷积核参数量为27CC，1个C通道的77卷积核参数量为49CC

1*1卷积核的作用

增加非线性因素的方式，也可以调整网络维度扩维或缩小维度

卷积层替代全连接层

全连接层可以接受的特征输入维度需要保持不变，否则会出现尺寸不匹配的问题，如果输入不同维度的特征，对卷积步长进行调整，就可以使网络接受不同维度的输入特征

训练数据的处理

对输入的图片进行等比变化，然后进行切割的方式，最后在进行水平翻转，RGB通道变化等方式增加数据量，多尺度数据可以通过随机裁剪或者中心裁剪等其他方法，增加数据量级

实验结果

1.LRN对网络性能提升没有帮助
2.对于同一个网络多尺度训练可以提高网络精度，尺度抖动(scale jittering)有利于网络性能提升
3.单尺度测试V1GG19效果最好，一定程度加深网路可以提高网络精度，多尺度测试VGG16效果最好
4.多个小卷积核比单个大卷积核更好(相比于AlexNet)
在这里插入图片描述

盏茶y

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
盏茶论文CV篇(二) Very Deep Convolutional Networks for Large-Scale Image Recognition

目录基本内容论文题目论文地址论文简介其他名称摘要翻译正文介绍网络架构感受野为什么使用3*3的卷积核1*1卷积核的作用卷积层替代全连接层训练数据的处理实验结果基本内容论文题目《Very Deep Convolutional Networks for Large-Scale Image Recognition》论文地址http://arxiv.org/abs/1409.1556.pdf论文...
复制链接

扫一扫