AlexNet

最新推荐文章于 2019-03-29 13:35:52 发布

Asun0204

最新推荐文章于 2019-03-29 13:35:52 发布

阅读量701

点赞数

分类专栏：深度学习人工智能论文笔记

本文链接：https://blog.csdn.net/Asun0204/article/details/79300999

版权

AlexNet是深度学习在图像识别领域的里程碑，通过5层卷积和3层全连接网络，结合ReLU激活函数和局部响应标准化，显著提升了ImageNet挑战赛的性能。数据扩增、Dropout等技术有效减少了过拟合，该模型在ILSVRC2010和2012上取得优异成绩。

摘要由CSDN通过智能技术生成

Imagenet classification with deep convolutional neural networks

AlexNet

Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems. 2012: 1097-1105.

总结

网络结构是5层卷积和3层全连接，使用不饱和激活函数ReLU加快训练速度，局部响应标准化LRU可以加快训练速度增加模型泛化能力，因为用了不饱和激活函数ReLU，所以不能再加快速度了。重叠池化，不容易过拟合，提升少许性能。本文的减少过拟合是一个重点，使用了随机裁剪和翻转，以及PCA改变图片像素值来作为数据扩增手段，另外还用了Dropout来减少过拟合。在预测方面，一张256图片，4角中心取5张，翻转后变成10张，取模型结果的平均作为最后的结果。结果在LSVRC-2010和2012上测评，单模型，集成5个模型和预训练模型。

摘要

ImageNet是一个数据集，有1500万标记过的高分辨率图片，22000个类别。

ImageNet Large-Scale Visual Recognition Challenge（ILSVRC）是用ImageNet部分数据集（1000个类别）举办的比赛，训练集120万张，验证机5000张，测试集15万张。有两个评价指标，top-1，top-5指预测出来概率前5的结果中包括了正确标签。

ImageNet图片大小不一，中心裁剪到256大小，使用训练集的均值对图片去均值。