AlexNet 论文粗读

最新推荐文章于 2024-02-26 03:43:30 发布

cztAI

最新推荐文章于 2024-02-26 03:43:30 发布

阅读量200

点赞数

分类专栏：深度学习框架文章标签： alexnet模型神经网络计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/czt_666/article/details/116710510

版权

本文详细解读AlexNet论文，探讨数据、算法和算力对其性能的影响。AlexNet通过ImageNet数据集进行训练，使用ReLU激活函数和数据增强策略，解决了过拟合问题。网络结构包含卷积、全连接层，引入了Max-pooling和局部响应归一化，两块GPU并行计算加速训练。在ILSVRC比赛中取得突破性成果，推动了深度学习在计算机视觉领域的广泛应用。

摘要由CSDN通过智能技术生成

一个人工智能系统，由数据、算法和算力构成。
在这里插入图片描述

1 数据

在我们学习的机器学习或深度学习知道，数据集很小会导致过拟合，它限制了网络的大小，也就限制了识别类别的数量。更大的数据集能提高网络的性能。

这篇论文使用的数据集是ImageNet。数据集ImageNet是一个包含超过1500万张高分辨率图像的数据集，大约22000个类别。

ILSVRC（ImageNet大规模视觉识别挑战赛）仅使用ImageNet的一个子集，在1000个类别中每个类别大约有1000张图片。总共大约有120万张训练图像，5万张验证图像和15万张测试图像。

AlexNet有6000个参数，1000个类别，这点数据量是不够的，论文采用图像平移、水平反射和改变RGB通道的强度实现数据增强

论文中的网络的输入维度恒定，而数据集的分辨率不是一样的，因此要将图像降采样到固定的256 × 256分辨率。

2 算法

算法就是论文中的网络，网络是神经网络的简称，神经网络由一个个神经元组成，而神经元是将上一个神经元的输出作为输入，然后对输入进行加权求和，最后经过一个激活函数，这个激活函数是非线性的，原因是非线性函数的分类（划分特征）能力比线性函数更强，因此一般激活函数都是非线性的。在卷积神经网络CNN中使用的是tanh饱和的非线性函数，而这篇论文使用一个新的激活函数–ReLU（线性整流函数）非饱和非

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。