卷积神经网络框架一：ALXE网络：ImageNet Classification with Deep Convolutional Neural Networks

最新推荐文章于 2024-07-12 11:45:29 发布

用GAN得有GPU

最新推荐文章于 2024-07-12 11:45:29 发布

阅读量592

点赞数

分类专栏：深度神经网络基础框架文章标签：深度学习网络框架 ALXE

本文链接：https://blog.csdn.net/qq_41967539/article/details/100995947

版权

深度神经网络基础框架专栏收录该内容

12 篇文章 1 订阅

订阅专栏

卷积神经网络框架之ALXE网络

原文：ImageNet Classification with Deep Convolutional Neural Networks

简述：
本文训练了截止当时为止最大卷积神经网络，并有效的减少测试错误率，进而提出了一种神经网络模型框架。本文提出Alexnet网络模型，该模型由5个卷积层，多个最大池化层和3个全连接层组成，并有效提出“dropout”正则方法以抑制过拟合，在实际应用中，将错误率大为减少。

问题or相关工作：
1.系统结构
与传统前馈神经网络相比，CNNs具有更少的连接和参数，因此更容易训练，提出Alexnet网络模型，该模型由5个卷积层，多个最大池化层和3个全连接层组成，并发现缺少任意层数都会影响最终误差率，重叠池化层可以有效减少0.5%左右的错误率，但具有重叠池化层的模型发现稍微难以overfit。
数据集选用imagenet，总共大约有120万张训练图像、50,000张验证图像和150,000张，将图像预处理，使得训练图像同意为256×256像素点，并置于RGB三通道，即大小为256×256×3。
用relu非线性函数在数据集上达到25%训练误差所需的迭代次数远远小于tanh函数，并对某些层应用ReLU非线性之后应用归一化。
本方案的“brightness normalization”与局部对比度归一化方案有一些相似之处，但我们没有减去mean activity,使得误差率降低1.5%左右。
通过两个GPU并行化相互读取对方内存，比单GPU网络快，并提出在未来更高效的GPU出现后，对更大的数据集训练后一定会使错误率再度降低。
2.抑制过拟合方法:
2.1 data augmentation：
生成图像平移和水平反射
改变训练图像中RGB通道的强度
2.2 Dropout：
目前多用结合多个模型进行预测的方法来抑制过拟合，但这种方法对大型神经网络来说过于昂贵，“dropout”的神经元不参与正向传递，也不参与反向传播。因此，每次输入时，神经网络都会对不同的体系结构进行采样，但所有这些体系结构都共享权重。这种技术减少了神经元复杂的协同适应，因为神经元不能依赖于特定的其他神经元的存在，以抑制过拟合。
2.3.weight decay 权重衰减：
权重衰减等价于L2范数正则化:
在这里插入图片描述