CV（计算机视觉）领域四大类之图像分类一（AlexNet）（含论文和源码）

小四01

已于 2022-10-04 12:52:58 修改

阅读量1.1k

点赞数 1

文章标签：人工智能 pytorch 多分类深度学习卷积神经网络

于 2022-09-14 18:04:13 首次发布

本文链接：https://blog.csdn.net/m0_61059963/article/details/126857417

版权

由于我个人学习图像分类的时候就是从lenet、alexnet开始学的，而lenet本身比较简单，因此就从alexnet开始写了，本系列会从alexnet开始写到最新的convNext、transformer等分类算法，如果后期有新的分类算法发表，我也会根据自己学习的情况持续更新。

代码git地址：xs-dl: 深度学习相关算法研究和实现 (gitee.com)（持续更新中）

1 alexnet网络结构

论文地址：ImageNet Classification with Deep Convolutional Neural Networks (neurips.cc)

上图来自于alex大神在2012年发表的ImageNet Classification with Deep Convolutional Neural Networks论文，当年其凭借alexnet算法力压以往传统算法，一举摘得2012年图像分类大赛的冠军。alexnet网络具有6000万个参数和650,000个神经元的神经网络由五个卷积层组成，随后是最大池化层，三个全连接层以及最后的1000个softmax输出。

2 alexnet网络参数

layer_name	kernel_size	kernel_num	stride	padding	input_size	output_size
conv1	11*11	96	4	[1, 2]	2242243	555596
max_pool1	3*3	/	2	/	555596	272796
conv2	5*5	256	1	[2, 2]	272796	2727256
max_pool2	3*3	/	2	/	2727256	1313256
conv3	3*3	384	1	[1, 1]	1313256	1313384
conv4	3*3	384	1	[1, 1]	1313384	1313384
conv5	3*3	256	1	[1, 1]	1313384	1313256
max_pool3	3*3	0	2	0	1313256	66256
fc1	4096	/	/	/	66256