AlexNet

本文出自NIPS2012,作者是大神Alex Krizhevsky,属于多伦多大学Hinton组。

转载:https://blog.csdn.net/tinyzhao/article/details/53035944

概述
本文提出的神经网络结构被成为AlexNet,在我最近的研究学习中发现,这一结构及其变种在很多任务中都有使用,回过头来重温一下这篇论文仍然是有必要的。归根到底,本文网络结构相对较浅,而且能够提取到比较丰富的特征,而很多任务的数据集无法达到ImageNet的规模,使用AlexNet是比较好的特征提取方法。本文相对较“老”,其中的很多技术早已耳熟能详,有兴趣的可以去阅读相关资料。

结构
AlexNet有5个卷积层和3个全连接层,作者发现移除任意一层都会降低最终的效果。网络结构如图:
在这里插入图片描述

这个网络前面5层是卷积层,后面三层是全连接层,最终softmax输出是1000类。具体分析第一层:
在这里插入图片描述

输入图片为2242243,卷积核大小为11113,步长为4,输出为555596。

ReLU
AlexNet使用ReLU代替了传统的激活函数,而现在ReLU已经广泛地使用在了各种CNN结构中。关于ReLU这里已经没必要讲了,在2012年算是新颖的技术,到今天已经是遍地开花了。

Multiple GPU
在这里插入图片描述

AlexNet使用两块GTX580显卡进行训练,两块显卡只需要在特定的层进行通信,当今的深度学习已经基本都是在显卡上完成的。两块GPU各训练网络的一部分,在第二个卷积层和全连接层才需要互相通信。

在卷积层之间还需要加上Local Response Normalization和Overlap Pooling。
在这里插入图片描述

Local Response Normalization
ReLU本来是不需要对输入进行标准化,但本文发现进行局部标准化能提高性能。
在这里插入图片描述

对它的理解可以参照:https://blog.csdn.net/sinat_21585785/article/details/75087768(✔)
https://blog.csdn.net/hduxiejun/article/details/70570086
https://blog.csdn.net/mao_xiao_feng/article/details/53488271(✔)

Overlap Pooling
一般的Pooling是不重叠的,而AlexNet使用的Pooling是可重叠的,也就是说,在池化的时候,每次移动的步长小于池化的边长。AlexNet池化的大小为3*3的正方形,每次池化移动步长为2,这样就会出现重叠。

总体而言,AlexNet网络的结构如下:
在这里插入图片描述

减小过拟合
AlexNet有6000万个参数,需要考虑过拟合的问题。

数据增强
对图片进行一些变换可以增大数据集。第一种方法是:原始图片大小为256256,在图片上随机选取224224的小块进行训练,还可以这些小块进行水平翻转进一步增加数据量。另一种方法是使用PCA改变训练图像RGB通道的像素值。

Dropout
这个方法现在也是大量使用。Dropout将隐层输出以一定的概率置0,这个神经元就不参与前向和后向传播,就如同在网络中删除了一样。Dropout也可以看成是一种模型组合,每个样本都是不一样的网络结构。Dropout减少了神经元之间的共适应关系(co-adaptation),一个神经元不再依赖另一个神经元,强迫网络学习到更加鲁棒的特征表示。

训练
使用SGD进行训练,batch大小为128,momentum为0.9,weight decay为0.0005。迭代公式:

vi+1:=0.9⋅vi−0.0005⋅ϵ⋅wi−ϵ⋅⟨∂L∂w|wi⟩Di
vi+1:=0.9⋅vi−0.0005⋅ϵ⋅wi−ϵ⋅⟨∂L∂w|wi⟩Di
wi+1:=wi+vi+1
wi+1:=wi+vi+1
在两块GTX580上花费了6天时间。

结果
在ILSVRC-2010上,top-1错误率为37.5%,top-5错误率为17.0%。比较有趣的是对96个11113的卷积和进行可视化:
在这里插入图片描述

可以看到这些卷积核学习到了很多和频率、方向相关的特征,而且在第一个GPU上大多是没有颜色,而第二个是有颜色的,这样的结果和初始化值无关。神经网络最后一层4096维的向量可以作为图像的高级特征,这样的特征可以用于其他的任务中。

作者:tinyzhao
来源:CSDN
原文:https://blog.csdn.net/tinyzhao/article/details/53035944
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CNN网络模型训练,数据为王,使用相同机器学习算法,不同质量的数据能训练出不同效果的模型如果你用谷歌搜索“AI+农业”或者“人工智能+农业”,就会发现与AI在其他领域的应用相比,农业依旧是未经广泛开垦的“蛮荒之地”。 专注新农业服务的新客科技创始人刘新农表示,这背后的原因有很多,基本上可以归结为三个原因:缺乏数据,人才稀少,鲜有关注。 但现在,情况有了变化。8月底,AI Challenger 2018联合新客科技发起了世界上首个农作物病害检测竞赛。竞赛中,会给参赛选手提供近5万张标注图片,覆盖10种植物的27种病害。 据悉,从开始比赛到现在,已经吸引了来自世界各地的29个国家的近1200支团队参赛。 从这个竞赛的情况来看,AI+农业,似乎正在迎来春天。 AI+农业 AI+农业,是一个非常广泛的领域。今年的AI Challenger竞赛只选择了其中的一个方向:农作物病害检测。 虽然只是其中的一个方向,但影响力不容小觑。据中国统计年鉴,2016年,由农业病害等灾害造成的直接损失超5000亿元,占农业生产总值的8.48%。 刘新农介绍说,在农业生产中,农药使用也在急剧增加。这不仅导致农药残留引发社会问题,还会加剧对环境的污染。对农作物进行准确的病害识别并推荐合适的防治措施,不仅对于农业生产意义重大,对于改善整个社会经济环境也有帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值