典型的CNN
具体代码实现可见同专栏下的博文
LeNet-5(手写识别系统)
LeNet-5共有7层,接受输入图像大小为28 × 28 (图错了)输出对应 10个类别的得分
-
C1层:卷积层,使用6个5×5的卷积核,得到6组大小为28×28 = 784 的特征映射(32-5+1)神经元数量为 6 × 784 = 4704,可训练参数数量为 6 × 25 + 6 = 156,连接数为156 × 784 = 122304(包括偏置)
**说明:**回顾一下前面的卷积模型,这里输入图像只有一个特征(D=1)每个卷积核 ( 5 * 5 ) 对输入图像进行卷积后直接得到卷积层对应的28 * 28的单层(D=1,因此没有将所有特征进行相加的操作),如此往复得到最终的C1,因此对于每层卷积层来说,连接数为 (5 * 5+1) * (28 * 28)(输出的每个元素都是由卷积核对输入图像进行一个连接数为26的映射得到的),故结果为6 * 26 * 28 * 28 = 122304。
-
**S2层:**汇聚层,采样窗口为