【论文详解】AlexNet(2012)

最新推荐文章于 2023-09-02 17:24:55 发布

小鹏聊智驾

最新推荐文章于 2023-09-02 17:24:55 发布

阅读量851

点赞数

分类专栏：图像分类文章标签： AlexNet 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chiyukunpeng/article/details/107448381

版权

图像分类专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章目录

1 论文信息

题目：ImageNet Classification with Deep Convolutional Neural Networks
代码：Tensorflow复现，Pytorch复现

2 摘要

AlexNet 是 Hinton 与其学生 Alex 参加2012年 ILSVRC 竞赛金牌算法，top-5的错误率降为17.0%，使CNN成为图像分类任务的核心算法模型。

其主要创新在于非线性激活函数ReLU，局部响应归一化，dropout，多GPU训练。

3 方法论

3.0 网络结构

在这里插入图片描述

3.1 非线性激活函数ReLU

此前常用的激活函数是 sigmoid，其主要缺陷在于：输入值过大或过小时会出现饱和现象，即梯度消失。

本文引入了ReLU函数， $f(x)=\max (0, x)$ ，如下图所示，其收敛速度要比 tanh 函数快得多。

在这里插入图片描述

3.2 多GPU训练

单个GPU的显存极大限制了网路的深度与宽度，采用多GPU训练可以极大提高网络的训练速度，也催生了更深更宽的网络模型。

3.3 局部响应归一化LRN

LRN是指被激活的神经元抑制相邻的神经元，目的是让每一个局部特征都得到缩小（缩小比例不一），提高泛化能力。公式如下：
$b_{x, y}^{i}=a_{x, y}^{i} /\left(k+\alpha \sum_{j=\max (0, i-n / 2)}^{\min (N-1, i+n / 2)}\left(a_{x, y}^{j}\right)^{2}\right)^{\beta}$
其中， $a_{x, y}^{i}$ 表示第 $i$ 个卷积核在(x,y)处经卷积、池化、ReLU激活后的输出； $N$ 是这一层卷积核的数目； $n$ 表示同一位置临近卷积核的个数，是超参数，需提前设定； $\alpha, \beta$ 都是超参数，需提前设定。

3.4 Dropout

dropout是指按照设定的概率随机将某个隐藏层神经元的输出设置为0，即此神经元不再参与前向传播与反向传播。目的是为了防止过拟合。

4 实验

4.1 定性分析

在这里插入图片描述

4.2 定量分析

在这里插入图片描述

小鹏聊智驾

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。