作者:teeyohuang
邮箱:teeyohuang@163.com
本文系原创,供交流学习使用,转载请注明出处,谢谢
深度学习论文随记(一)---AlexNet模型解读
ImageNet classification with deep convolutional neural networks
Author: A Krizhevsky, I Sutskever , GE Hinton
Year:2012
1、导引
其实这篇论文按道理讲,并不是第一个把卷积神经网络应用到深度学习中的工作,往前其实有个LeNet,是深度学习三驾马车之一的Yann Lecun在1998年就设计出来了。
但是一般深度学习入门要看的第一篇论文,还是会推荐这篇,我个人认为,这篇论文的意义在于,它是使得Deep Learning这种机器学习的方法征服计算机视觉领域的开山之作。
2012年,深度学习三驾马车中的另一位 Geoffrey Hinton为了证明自己的研究工作是有用的,他和他的学生Alex Krizhevsky 在ILSVRC竞赛中出手,刷新了classification的记录,一战封神!!!所以,这篇文章所述的网络结构也就被称为AlexNet。至此之后,无数的学者投入到Deep Learning的研究中去。
2、AlexNet模型解读
这张图片本来上半部分就没有,论文中就是给的这个图。
然后之所以用的上下两半一样的结构,是因为他们当时用的GPU计算力有限,所以用了两块GPU:GTX 580。现在都是2017年了,你笔记本上的GPU估计都是GTX970了,所以下面讲的时候就当作是只用的一个GPU来分析。
AlexNet共有八层,有60M以上的参数量。
前五层为卷积层:c