Abstract(摘要)
1、model:5个卷积流,3个全连接层,100类
2、dataSet: LSVRC-2010
3、为了降低过拟合,使用 dropout
4、top 1 error :第一个标签对时,才算对
top 5 error :前5个标签有1个对,就算对
5、设计了一个很好的GPU计算框架
1、Introduction(引言)
1、小数据无法训练深度模型
2、要从识别大量图片中识别目标,需要一个具备强大学习能力的模型,巨大的识别复杂性意味着即便是Imagenet这么大的数据集也不够,所以需要先验知识来补偿数据集不具备的信息;
3、卷积模型的学习能力可以通过改变模型层数和每层单元个数来实现,对自然图像的统计平稳性和局部像素依赖性做出正确估计;
4、2D 卷积 GPU 框架可以实现CNN,可以训练大型数据集,而且并不需要特别严厉的overfitting 处理机制
5、本文重点:训练了一个大型CNN网络应用到ImageNet数据集上;
写了一个在GPU上运行的 高效的CNN2D实现框架;
我们的网络有一些新的(不常见的)特征提高性能,减少训练时间
将overfitting作为一个主要任务
模型有5个卷积流和3个全连接层(减少任何一个卷积层都会使效果下降)
2、The Dataset(数据集)
1、ImageNet Large-Scale Visual Recognition Challenge(ILSVRC)
2、resourceImage rescale the shorter side of 256 resultImage crop out the central 256*256 patch 256*256
--------------------------------------------- > -------------------------------------------------->
3、没有图像预处理,只是减去每个像素的均值
3、The Architecture(框架)