这篇文章提出了很多卷积神经网络的先驱——AlexNet。
和其他的很多前馈神经网络相比,由于CNN的卷积层不是全相联的,所以CNN的参数会少很多,而且训练起来会更加地容易。
作者在训练AlexNet的时候,为了加快速度,使用了两块GTX 580 3GB GPU,并且对网络的结构进行了一定的改造以更好地适应GPU的性质。
1 总体框架
AlexNet的网络基本结构为:输入层——5层卷积层——三层fully connected。
详细可见:https://github.com/BVLC/caffe/blob/master/models/bvlc_alexnet/deploy.prototxt
Layer | Filter Size | Stride | Normalization | Single GPU | Dropout | Activation Function |