前言
Alex在2012年提出的alexnet网络结构模型引爆了神经网络的应用热潮,并赢得了2012届图像识别大赛的冠军,使得CNN成为在图像分类上的核心算法模型。 由于这时候的GPU性能还不足,Alex采用两块GPU同时训练模型,模型被分成了两路,但是现在的GPU性能已经完全可以容得下整个网络的训练,因此在网络分离这部分可以忽略。
整个网络共有8层,前5个为卷积层,后三层是全连接层。
第一层-卷积层1
- 输入的图片大小为:227*227*3
- 第一次卷积操作,卷积核大小11*11*3,尺寸为96,步长4,边缘丢弃。因此卷积输出为55*55*96。(227-11)/4+1=55.
- 卷积层后跟ReLU,尺寸不变.
- 最大池化层,核大小为3*3,步长为2,因此feature map的大小为:27*27*96.(55-3)/2+1=27
第二层-卷积层2
- 输入的图片就是第一层输出,大小为:27*27*96
- 第一次卷积操作,卷积核大小5*5*96,尺寸为256,步长1,边缘补齐。因此卷积输出为27*27*256。
- 卷积层后跟ReLU,尺寸不变.
- 最大池化层,核大小为3*3,步长为2,因此feature map的大小为:13*13*256.(27-3)/2+1=13