有好多人写了好多关于CNN,关于2012年ImageNet的博客,这里我来记录一下自己学习所了解到的一些东西,有可能不全面,等想到什么再进行补充吧。
Paper:2012 ImageNet Classification with Deep Convolution Neural Networks
疑问:
关于本文还有疑问,各位看客如果知道的话,望给解答
(1)关于数据的问题
在论文的2 The Dataset 里面讲到由于ImageNet的images的图像分辨率不同,而文章所用的CNN的输入需要是同一分辨率的,So,作者将所有images的分辨率固定为256*256。那为什么在文章 3.5 overall Architecture中网络结构的输入是224*224*3 ??
(2)关于网络结构
文章中提到网络结构分为8层,前5层为卷积层,后3层为全连接层。问:前5层网络中,为什么只有前两层有pooling层,而后边的卷积没有进行pooling?
Abstract
Train: 1.2 million high-resolution images into 1000 classes
在test集上,error rate有所降低
网络结构:5个卷积层(有些层后会有max-pooling),3层全连接层,用softmax分类
为了快速训练:卷积层用非饱和的神经元(non-saturating neurons)和高效的GPU。
为了降低全连接层的过拟合问题:用dropout(&&&&&)。
Introduction