ImageNet Classification with Deep Convolutional Neural Networks
NIPS-Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton-2012
思路
训练了一个大型的深度卷积神经网络,将ImageNet LSVRC-2010竞赛中的120万张高分辨率图像分类为1000个不同的类别。
神经网络有6000万个参数和650000个神经元,由五个卷积层组成,其中一些层后面是最大池层,还有三个全连接层,最后是1000路softmax。
文章选择使用GPU实现卷积运算,有比较高效的效率;使用非饱和神经元。
为了减少全连接层中的过拟合,采用dropout正则化。
模型的变体在比赛中获得了15.3%的TOP-5测试错误率[NO.1],第二名的错误率为26.2%。
数据集介绍
ImageNet是一个包含超过1500万个标记的高分辨率图像的数据集,属于大约22,000个类别。
ILSVRC竞赛使用ImageNet的一个子集,在1000个类别中的每个类别中大约有1000张图像。总共有大约120万张训练图像,5万张验证图像和15万张测试图像。
ILSVRC-2010是ILSVRC的唯一版本,测试集标签可用,因此这是我们执行大部分实验的版本。由于我们也在ILSVRC-2012竞赛中输入了我们的模型,因此也报告了这个版本的数据集的结果,其中测试集标签不可用。
数据集由可变分辨率的图像组成,而模型需要不变的输入维度。因此将图