(俗话说:大树底下好乘凉,站在大佬的肩膀上我就可以少写一点啦,哈哈)
原作地址:http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
参考文章:
1、AlexNet论文(ImageNet Classification with Deep Convolutional Neural Networks)(译)这位大佬把原作翻译了一遍,基本上还是很准确的,除了一些细节需要看一下原文;
2、局部响应归一化层(LRN)这位大佬详细讲解了局部响应归一化,在读文章时没有整明白局部响应归一化的公式,所以看了原作、找了一些资料,关键困扰点:公式中求和的范围比较抽象,话不多说,看完下图再比对着公式,相信小伙伴们立刻就懂了:
公式中参数的意思,可以看下面我的手写笔记3.3,也可以看参考文章1或原作,都可以啦。
边看边做了一些笔记,方便以后回忆,其实文章还是蛮好懂的,网络架构在网上也可以找到一大堆,关键在于文章中所讲的数据增强那一块:怎么从256*256的图片中通过平移和水平映射来增加2048倍的数据量?知道的小伙伴可以一起讨论一下。
首先附上一张AlexNet的网络结构:
接下来附上我的手写笔记,希望大家多多指教:
最后再补充一点数据增强的方法,也是参考文章: 【方法】数据增强(Data Augmentation)