Caffe经典模型——图像分类LeNet-5

本文详细介绍了Caffe中的LeNet-5模型,包括其网络框架、层结构和工作原理。LeNet-5共有8层,通过卷积、池化和全连接层提取图像特征,用于MNIST数据集的图像分类任务。训练和测试网络分别通过train_lenet.sh和test_lenet.sh脚本进行。
摘要由CSDN通过智能技术生成
  • LeNet网络框架如下图:

LeNet-5 包括输入层一共8层,每一层都包含多个参数(权重和偏置).

第一层: 输入层大小32*32,但是Caffe中MNIST数据集中的图片大小都是28*28,这样设计是为了让潜在的明显特征(笔画断续,角点)能够出现在最高层特征检测子感受野的中心.

第二层: 卷积层,卷积核大小 5 * 5, 步长为1, 卷积模板数 6, 对输入层进行卷积操作后,得到的特征图大小为 (32 - 5 + 1) * (32 - 5 + 1) = 28 * 28, 通过C1层的卷积操作,使得原始信号特征增强,并降低了噪声,而且不同的卷积核能够提取图像中不同的特征;

第三层: 池化层, 滑动窗口大小 2 * 2, 滑动步长 2, 对C1层进行最大化池化操作后,得到的特征图带下为 28 / 2   *  28 / 2 = 14 * 14,

第四层:卷积层, 卷积核大小 5 * 5, 步长为1, 卷积模板数 16, 对S2层进行卷积操作后,得到的特征图大小为 (14 - 5 + 1) * (14 - 5 + 1) = 10 * 10,

第五层: 池化层, 滑动窗口 2 * 2 , 滑动步长 2, 对 C3 层进行最大化池化操作后,得到的特征图大小为 10 / 2  *  10 / 2 = 5 * 5,

第六层: 卷积层, 卷积核大小 5 * 5, 步长为1, 模板数为120, 对 S4 层进行卷积操作后,得到的特征图大小为 (5 - 5 + 1) * (5 - 5 + 1) = 1 * 1,

第七层: 全连接层, F6层一共有 84 个神经元, 每个神经元与C5层全连接,  F6层计算输入向量和权重向量的之间的点积以及与偏置的和,之后进过Sigmoid函数.

第八层: 输出层, 一共有10各神经元,采用径向基函数(RBF)的网络连接方式,其输出的计算方式:

y_{i}=\sum_{j}(x_{j}-w_{ij})^{2}

RBF的值由i的比特图编码确定,越接近-,则越接近i的比特图编码.

 

  • 模型描述文件 LeNet_train_val.prototxt
name: "LeNet"				// 网络(Net)的名称为LeNet
layer {					// 定义一个层(Layerÿ
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值