AlexNet论文学习

yflw_LDY

于 2023-08-14 23:07:16 发布

阅读量89

点赞数

分类专栏：经典论文文章标签：学习深度学习计算机视觉论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yflw_LDY/article/details/132277277

版权

经典论文专栏收录该内容

1 篇文章 0 订阅

订阅专栏

AlexNet

研究背景

ILSVRC：大规模图像识别挑战赛

在这里插入图片描述

强大计算资源-GPU

高性能计算计算资源使得大型神经网络可以加速训练

研究成果

AlexNet在ILSVRC-2012以超出第二名10.9个百分点夺冠
在这里插入图片描述

研究意义

AlexNet历史意义：

拉开卷积神经网络统治计算机视觉的序幕
加速计算机视觉应用的落地

在这里插入图片描述

AlexNet结构

网络连接方式

在这里插入图片描述
该网络（AlexNet）由5个卷积层和3个全连接层构成，共计6000万参数，65万个神经元

LRN只在第1和第2层
ReLU存在于所有的卷积层
Max Pooling只在第1、第2和第5层

在这里插入图片描述

数据流计算

CONV1

Conv-ReLU-Pool-LRN
在这里插入图片描述
pytorch在计算卷积后特征图分辨率的时候采用向下取整

参数计算公式：Fi * (Ks * Ks) * Kn + Kn
其中：Fi：输入的图片的维度；Ks：卷积核大小；Kn：卷积核数量

卷积层1的连接参数：3 * (11 * 11) * 96 + 96 = 34,944

CONV2

Conv-ReLU-Pool-LRN
在这里插入图片描述
卷积层2的连接参数：96 * (5 * 5) * 256 + 256 = 614,656

CONV3

Conv-ReLU

在这里插入图片描述
卷积层3的连接参数：256 * （3 * 3）* 384 +384 = 885,120

CONV4

Conv-ReLU
在这里插入图片描述
卷积层4的连接参数：384 * (3 * 3) *384 + 384 = 1,327,488

CONV5

Conv-ReLU-Pool
在这里插入图片描述
卷积层5的连接参数：384 * (3 * 3) * 256 + 256 = 884,992

3个全连接层

在第5个卷积层的输出，接3个全连接层，分别卷积个数为：4096-4096-1000(softmax)这里的1000是因为ImageNet的类别有1000个，且输出的概率所以接一个softmax

FC-1的连接参数：6 * 6 * 256 * 4096 + 4096 = 37,752,832
FC-2的连接参数：4096 * 4096 +4096 = 16,781,312
FC-3的连接参数：4096 * 1000 + 1000 = 4,097,000

通过计算可知：整个网络参数最多的发生在全连接层，因此后续很多网络会根据这个缺点进行相应的改进

结构特点

AlexNet在进行训练的时候分别采用了ReLU、LRN以及Overlapping

ReLU

激活函数采用ReLU函数，替换激活函数的优点：使网络训练的更快；防止梯度消失；使网络具有稀疏性
在这里插入图片描述

Overlappping Pooling

采用重叠卷积，分降低了0.4%和0.3%的top-1和top-5

在这里插入图片描述

LRN

局部响应标准化：有助于AlexNet泛化能力的提升受真实神经元侧抑制的启发

侧抑制：细胞分化变化时，它会对周围细胞产生抑制信号，阻止它们向相同方向分化，最终表现为细胞命运不同
在这里插入图片描述
公式其实表达的就是：输出的数中如果旁边出现一个比较大的输出，那么就会对旁边产生较大的抑制
注：VGG中已经证明LRN无用

训练技巧

在训练模型的时候采用Data Augmentation和Dropout

Data Augmentation

方法一：针对位置

训练阶段：
1.图片统一缩放至256*256；
2.随机位置裁剪出224*224区域；
3.随机进行水平翻转

测试阶段：
1.图片统一缩放至256*256；
2.裁剪出5个224*224区域
3.均进行水平翻转，共得到10张224*224图片

在这里插入图片描述

方法二：针对颜色

通过PCA方法修改RGB通道的像素值，实现颜色扰动，效果有限，仅在top-1提升1个点

dropout

采用dropout的方式去失活神经元从而防止容易出现过拟合的现象

注意事项：训练和测试两个阶段的数据尺度变化

实验结果及分析

1. 采用了卷积核可视化得出

卷积核呈现出不同的频率、方向和颜色
两个GPU还呈现分工学习

在这里插入图片描述

2. 特征相似性

相似图片的第二个全连接层输出特征向量的欧式距离相近

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
AlexNet论文学习

AlexNet论文笔记
复制链接

扫一扫

专栏目录

yflw_LDY CSDN认证博客专家 CSDN认证企业博客

码龄3年

5: 原创

195万+: 周排名

177万+: 总排名

613: 访问

: 等级

50: 积分

0: 粉丝

0: 获赞

3: 评论

2: 收藏

私信

关注

热门文章

分类专栏

pytorch 4篇
经典论文 1篇

最新评论

pytorch学习（3）计算图和动态图
CSDN-Ada助手: 非常感谢您的持续创作，恭喜您写了第四篇博客！标题为《pytorch学习（3）计算图和动态图》，我在阅读了您的博文后，对pytorch的计算图和动态图有了更深入的理解。您的文章内容清晰易懂，让我受益匪浅。在下一步的创作中，我建议您可以进一步探索pytorch的高级功能或者深入研究某个具体的应用场景。通过更深入的学习和研究，您可以为读者们带来更多有价值的内容。无论您选择哪个方向，我相信您的博客会继续给读者们带来启发和帮助。再次祝贺您，并期待您的下一篇博文！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
pytorch学习（4）outgrad与逻辑回归
CSDN-Ada助手: 恭喜您写了第5篇博客！标题中的“outgrad与逻辑回归”听起来很有趣。您对PyTorch的学习进程非常令人钦佩，持续写作对于巩固知识和与他人分享经验都非常有益。接下来，我建议您可以尝试探索更多与PyTorch相关的主题，比如深度学习中的图像分类或者自然语言处理。期待您的下一篇博客！
pytorch学习（1）张量简介与创建
CSDN-Ada助手: 评论：非常鼓励您持续创作关于pytorch学习的博客！这篇博文的标题和摘要清晰明了，让读者能够快速了解到您所分享的内容。在学习pytorch时，了解张量的概念和创建方法是非常重要的一步，而您的博文正是为我们提供了这方面的基础知识。除了张量的概念和创建方法，您可以考虑在未来的博文中介绍一下张量的运算和操作。例如，您可以分享一些常用的张量运算，如加法、减法、乘法和除法，并展示如何使用pytorch实现这些操作。此外，您还可以介绍一些高级的张量操作，如张量的切片、重塑和拼接，这些技巧可以帮助读者更好地处理复杂的数据。感谢您的分享，并期待您未来更多关于pytorch学习的博文！请继续努力，谦虚地分享您的知识和经验，让更多的读者受益。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。