《深度学习21天实战caffe》第6天学习笔记

最新推荐文章于 2024-03-28 07:19:34 发布

zt_1995

最新推荐文章于 2024-03-28 07:19:34 发布

阅读量2.2k

点赞数

分类专栏： -------深度学习------- 文章标签：深度学习

-------深度学习------- 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

这一节的学习主要是通过手写体数字识别例程来熟悉caffe的基本使用。

首先下载MNIST数据集

$ cd data/mnist
$ ./get_mnist.sh

下载到四个文件
训练集（图片）train-images-idx3-ubyte
训练集（标签）train-labels-idx1-ubyte
测试集（图片）t10k-images-idx3-ubyte
测试集（标签）t10k-labels-idx1-ubyte

下载到的文件为二进制文件，可以执行下面命令来把文件转换为caffe能识别的文件（LEVELDB或LMDB）

$ ./examples/mnist/create_mnist.sh

LeNet-5 模型

利用可视化工具，将examples/mnist/lenet_train_val.prototxt中模型结构绘制出来
可视化工具可以用下述链接
http://ethereon.github.io/netscope/quickstart.html

点击launch editor
把.prototxt文件复制进去，按shift+enter 就可以看到模型
这里写图片描述

LeNet-5的工作流程如下，输入层是28*28的感知节点，接受原始图像。
第一层：卷积层，用20个5*5的卷积核进行特征提取，提取出20个（28-5+1）*（28-5+1）的特征图送下层处理。
第二层：子采样层，采用最大池化的方法来缩小数据规模，用2*2的输入域，将4个数用一个最大的数来替代。
第三层：卷积层，同第一层一样，只是这一层用了50个卷积核生成了50个特征图。
第四层：子采样层，同第二层一样。
第五层：全连接层，这一层共产生500个节点，它如同BP神经网络一样，计算输入向量和权重向量直接的点积，再加上一个偏置，然后将其传递给激励函数（ReLU）计算。
第六层：全连接层，共有10个节点，分别代表数字0到9。

训练超参数

$ ./examples/mnist/train_lenet.sh

训练过程很长，我截取了部分
这里写图片描述

可以看到最后在10000次迭代后，准确度达到了99.18%
最终训练模型保存在 examples/mnist/lenet_iter_10000.caffemodel
训练状态保存在examples/mnist/lenet_iter_10000.solverstate

最后利用训练好的模型对数据进行预测

$ ./build/tools/caffe.bin test \
-model examples/mnist/lenet_train_test.prototxt \
-weights examples/mnist/lenet_iter_10000.caffemodel \
-iterations 100

这里写图片描述