模型组成
- 输入层
- 5个卷积层
- 3个全链接层
其中3个卷积层进行了最大池化。
AlexNet模型的结构示意图如下所示
模型主要结构: 输入数据—>卷积、池化、ReLu激活—>卷积、池化、ReLu激活—>卷积、ReLu激活—>卷积、ReLu激活—>卷积、池化、ReLu激活—>全连接、ReLu激活、droupout—>全连接、ReLu激活、droupout—>输出
AlexNet 各层的详细描述
输入层: 输入大小为224 x 224的3通道图像
第1层:卷积层(卷积、池化)
-
使用96个大小为11 x 11 x 3的卷积核,分两组(每组48个),按步长4个像素对输入层进行卷积运算,得到两组55 x 55 x48 的卷积结果。
-
对卷积结果使用ReLu激活函数,得到激活结果。
-
对激活结果使用窗口为3 x 3、步长为2个像素的重叠最大池化,得到27 x 27 x 48的池化结果。
-
对池化结果使用局部响应归