一、经典卷积神经网络剖析
卷积神经网络中较位经典的网络有LeNet-5、AlexNet、VGG16等,下面分别进行介绍:
LeNet-5这一神经网络模型是Yann LeCun 教授于1998年在论文 Gradient-based learning applied to document recognition 中提出的,其主要用于手写数字识别,并达到了很好的识别效果,其模型如下:
其网络结构不包括输入层(input layer), 则主要包含七层,即两组卷积+池化,之后是三层全连接层,具体网络层参数计算可依据如下公式进行计算:
其中,各字母的含义如下:
O:输出图像的尺寸。 I:输入图像的尺寸。
K:卷积层的核尺寸 N:核数量
S:移动步长 P :填充数
网络层名称 | 输入 | filter | stride | padding | 输出 | 计算公式 | 参数量 |
---|---|---|---|---|---|---|---|
input | 32x32x1 | 32x32x1 | |||||
conv1 | 32x32x1 | 5x5x6 | 1 | 0 | 28x28x6 | (32-5+2*0)/1+1 = 28 | (5*5+1)*6 = 156 |