LeNet网络详解
LeNet网络是Yann LeCun大神的论文,来源Gradient-Based Learning Applied to Document Recognition
具体结构如下:
input->C1
由32*32的图像 经过6个卷积核的操作,生成六个feature maps ,也就是输出特征图(28*28)C1->S2
下采样层(pooling),生成6个14*14的feature mapsS2->C3
通过特征图组合的方式,生成16个10*10的feature maps,在caffe中的实现并没有这样的组合,直接通过16个卷积核生成16个feature maps ,每个卷积核大小是6*5*5,其中6对应S2层中的6个输入feature maps,5*5代表卷积核的宽和高。
具体如下图:
*C3->S4
下采样层,从16个10*10的feature maps传化层16个5*5的feature maps。S4->C5
卷积操作,同S2->C3类似,生成120个feature maps,每个feature maps的大小是1*1
C5->F6
全连接操作,可以借鉴神经网络的连接方式,输出84个feature maps,每个feature maps是1*1大小F6->输出层
通过欧式径向基函数的方式得到结果,简单来说就是通过一个类似W矩阵的二维数组,数组中的每行减去输入向量就是最后的输出向量,如下
{a0,a1,a2,…,a9} = {