浅述经典的4种卷积网络之（1）AlexNet

最新推荐文章于 2024-04-22 14:42:36 发布

萱子子子

最新推荐文章于 2024-04-22 14:42:36 发布

阅读量889

点赞数

分类专栏：神经网络卷积神经网络 tensorflow 深度学习

本文链接：https://blog.csdn.net/xuan_zizizi/article/details/78114448

版权

tensorflow 同时被 3 个专栏收录

12 篇文章 0 订阅

订阅专栏

神经网络

11 篇文章 0 订阅

订阅专栏

深度学习

10 篇文章 0 订阅

订阅专栏

这里不对AlexNet网络进行详细的原理阐述，只是卷积网络的由来以及网络结构和网络参数进行叙述，然后通过tensorflow进行代码实现，参看《tensorflow实战》。
1.AlexNet网络叙述
获得2012年ILSVRC比赛分类项目的冠军，top-5错误率16.4%，使用额外数据可达到15.3%2012年Hinton的学生Alex Krizhevsky提出了深度卷积神经网络模型AlexNet，是LeNet的更深更宽版本。包含了6亿3000万个连接，6000个参数和65万个神经元，8层神经网络（不包括池化和LRN），其中有5个卷积层，其中三个卷积层后面连接了最大池化层，最后还有3个全连接层。最后一层是有1000类输出的softmax层用作分类，LRN出现在第一个和第二个卷积层后，而最大池化层出现在两个LRN和最后一个卷积层后，ReLU则应用在这8个层每一层的后面，AlexNet训练时使用2个GPU，故结构图部分被拆为2个部分。

图1 AlexNet网络结构图
如图1所示，我们可以分析网络经过卷积和池化之后的参数数量：

layer	input size	filter size	filter number	output size	strides	pooling type
conv1	2242243	11113	96	555596	4	valid
LRN1
max pooling1	555596	3*3	96	272796	2	valid
conv2	272796	5596	256	2727256	1	same
LRN2
max pooling2	2727256	3*3	256	1313256	2	valid
conv3	1313256	33256	384	1313384	1	same
conv4	1313384	33384	384	1313384	1	same
conv5	1313384	33384	256	1313256	1	same
max pooling3	1313256	3*3	256	66256	2	valid
FC1	66256			4096
FC2	4096			4096
FC3	4096			1000

AlexNet首次在CNN中成功应用了ReLU、Dropout和LRN等Trick，AlexNet包含了几个新的技术点如下：
①成功使用ReLU作为CNN的激活函数，验证其在深层网络上超过sigmoid函数，成功解决了sigmoid在网路较深时的梯度弥散问题。
②训练时采用dropout随机忽略一部分神经元，以避免过拟合。在AlexNet里面将最后几个全连接层使用了dropout。
③在CNN中使用重叠的最大池化层。此前CNN一般使用平均池化，AlexNet避免了平均池化带来的模糊效果，并且提出了让步长比池化尺寸小，这样池化的输出之间会有覆盖和重叠，提升了特征的丰富性。
④提出了LRN层，对局部神经元的活动创建竞争机制，使得响应较大的值变得相对更大，并抑制其他反馈小的神经元，增强了模型泛化能力。
⑤使用CUDA加速深度网路的训练，利用GPU强大的计算能力，处理神经网络训练时大量的矩阵运算。
⑥数据增强，随机从256*256的原始图像中截取224*224大小的区域（以及水平翻转的镜像），相当于增加了（256-224）^2*2=2048倍的数据量。减轻过拟合，增强泛化能力。进行预测时，取图片的四个角和中间并进行左右翻转，总共获取10张图片进行识别，最后对十次结果求平均值。同时，AlexNet提到对rgb图像进行PCA处理，并对主成分做一个标准差为0.1的高斯扰动，这个trick可以下降1%错误率。
2.AlexNet网络tensorflow实现

啦啦啦~后续待进啦啦啦~