mnist是一个大型的手写体数字数据库,广泛应用于机器学习领域的训练和测试。mnist对每张图都已经进行尺寸归一化,固定尺寸28像素x28像素。
下面开始手写体的简单例子测试caffe的安装情况。(注:未编译安装caffe请移步到我的博客:Ubuntu14.04下深度学习平台caffe的安装 文章)
1.下载mnist数据集
mnist部分数据集可以在caffe根目录下data/mnist下用get_mnist.sh脚本下载。
$ cd data/mnist
$ ./get_mnist.sh
下载好后可以看到4个数据文件。
2.转换格式
下载到的原始数据集未二进制文件,文件格式可到mnist网站进行查询。caffe需要识别LEVELDB或LMDB,我们只需要在caffe根目录下执行
$ ./examples/mnist/create_mnist.sh
浏览examples/mnist目录,发现生产了examples/mnist/mnist_train_lmdb/和examples/mnist/mnist_test_lmdb/两个目录, 每个目录下都有两个两个文件:data.mdb和lock.mdb
mnist_train_lmdb是训练集,mnist_test_lmdb是测试集。
让我们查看脚本的实现:
#!/usr/bin/env sh
# This script converts the mnist data into lmdb/leveldb format,
# depending on the value assigned to $BACKEND.
set -e
EXAMPLE=examples/mnist
DATA=data/mnist
BUILD=build/examples/mnist
BACKEND="lmdb"
echo "Creating ${BACKEND}..."
rm -rf $EXAMPLE/mnist_train_${BACKEND}
rm -rf $EXAMPLE/mnist_test_${BACKEND}
$BUILD/convert_mnist_data.bin $DATA/train-images-idx3-ubyte $DATA/train-labels-idx1-ubyte $EXAMPLE/mnist_train_${BACKEND} --backend=${BACKEND}
$BUILD/convert_mnist_data.bin $DATA/t10k-images-idx3-ubyte $DATA/t10k-labels-idx1-ubyte $EXAMPLE/mnist_test_${BACKEND} --backend=${BACKEND}
echo "Done."
上面脚本调用了bin/convert_mnist_data.bin这个可执行程序,对应源文件为examples/mnist/convert_mnist_data.cpp,有兴趣可自行查阅其实现。
3.训练超参数
使用经典的LeNet-5模型进行训练,模型的描述文件为examples/mnist/lenet_train_val.prototext。
运行example/mnist/train_lenet.sh脚本。先用vi打开改脚本,内容如下
#!/usr/bin/env sh
set -e
./build/tools/caffe train --solver=examples/mnist/lenet_solver.prototxt
可见,调用了我们编译好的build/tools/caffe可执行文件,参数–solver=examples/mnist/lenet_solver.prototxt指定了训练超参数(Hyper-Parameter)文件。
我们打开examples/mnist/lenet_solver.prototxt文件,其中
net: "examples/mnist/lenet_train_test.prototext"
一行定义了训练网络的描述文件。最后一行
solver_mode: CPU
指定了训练使用的模式,如果已经配置好CUDA,可以改为GPU。运行此脚本,等待训练完毕。(使用GPU模式在本人机器GT740M+i5 3230M上耗时5分钟,使用CPU模式大概为15-20分钟)
从图中可以看出,最后的训练分类准确率为99.08%,最终训练的模型权值保存早examples/mnist/lenet_iter_10000.caffemodel文件中训练状态则保存在examples/mnist/lenet_iter_10000.solverstate文件中。这两个文件都是ProtoBuffer二进制格式文件。
4.预测
利用训练好的模型权值文件examples/mnist/lenet_iter_10000.caffemodel可以对测试数据集进行预测。运行如下命令
$ ./build/tools/caffe test -model examples/mnist/lenet_train_test.prototext -weights examples/mnist/lenet_iter_10000.caffemodel -itearations 100
命令的参数解释:
- ./build/tools/caffe test 表示只做预测(前向传播计算),不进行参数更新(反向传播计算)
- -model examples/mnist/lenet_train_test.prototext 指定模型描述文本文件
- -weights examples/mnist/lenet_iter_10000.caffemodel 指定预先训练好的权值文件
- -itearations 100 指定迭代次数
执行命令后如图所示,得到预测结果。