手写体数字识别例子

最新推荐文章于 2024-08-09 14:43:36 发布

Jay__Feng

最新推荐文章于 2024-08-09 14:43:36 发布

阅读量3.7k

点赞数

分类专栏： deep-learning 文章标签：深度学习

本文链接：https://blog.csdn.net/github_37953781/article/details/63002839

版权

deep-learning 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

mnist是一个大型的手写体数字数据库，广泛应用于机器学习领域的训练和测试。mnist对每张图都已经进行尺寸归一化，固定尺寸28像素x28像素。
下面开始手写体的简单例子测试caffe的安装情况。（注：未编译安装caffe请移步到我的博客：Ubuntu14.04下深度学习平台caffe的安装文章）

1.下载mnist数据集

mnist部分数据集可以在caffe根目录下data/mnist下用get_mnist.sh脚本下载。

$ cd data/mnist

$ ./get_mnist.sh

下载好后可以看到4个数据文件。
这里写图片描述

2.转换格式

下载到的原始数据集未二进制文件，文件格式可到mnist网站进行查询。caffe需要识别LEVELDB或LMDB，我们只需要在caffe根目录下执行

$ ./examples/mnist/create_mnist.sh

浏览examples/mnist目录，发现生产了examples/mnist/mnist_train_lmdb/和examples/mnist/mnist_test_lmdb/两个目录，每个目录下都有两个两个文件：data.mdb和lock.mdb
这里写图片描述
mnist_train_lmdb是训练集，mnist_test_lmdb是测试集。
让我们查看脚本的实现：

#!/usr/bin/env sh
# This script converts the mnist data into lmdb/leveldb format,
# depending on the value assigned to $BACKEND.
set -e

EXAMPLE=examples/mnist
DATA=data/mnist
BUILD=build/examples/mnist

BACKEND="lmdb"

echo "Creating ${BACKEND}..."

rm -rf $EXAMPLE/mnist_train_${BACKEND}
rm -rf $EXAMPLE/mnist_test_${BACKEND}

$BUILD/convert_mnist_data.bin $DATA/train-images-idx3-ubyte $DATA/train-labels-idx1-ubyte $EXAMPLE/mnist_train_${BACKEND} --backend=${BACKEND}
$BUILD/convert_mnist_data.bin $DATA/t10k-images-idx3-ubyte $DATA/t10k-labels-idx1-ubyte $EXAMPLE/mnist_test_${BACKEND} --backend=${BACKEND}

echo "Done."

上面脚本调用了bin/convert_mnist_data.bin这个可执行程序，对应源文件为examples/mnist/convert_mnist_data.cpp，有兴趣可自行查阅其实现。

3.训练超参数

使用经典的LeNet-5模型进行训练，模型的描述文件为examples/mnist/lenet_train_val.prototext。
运行example/mnist/train_lenet.sh脚本。先用vi打开改脚本，内容如下

#!/usr/bin/env sh
set -e
./build/tools/caffe train --solver=examples/mnist/lenet_solver.prototxt

可见，调用了我们编译好的build/tools/caffe可执行文件，参数–solver=examples/mnist/lenet_solver.prototxt指定了训练超参数（Hyper-Parameter）文件。
我们打开examples/mnist/lenet_solver.prototxt文件，其中

net: "examples/mnist/lenet_train_test.prototext"

一行定义了训练网络的描述文件。最后一行

solver_mode: CPU

指定了训练使用的模式，如果已经配置好CUDA，可以改为GPU。运行此脚本，等待训练完毕。（使用GPU模式在本人机器GT740M+i5 3230M上耗时5分钟，使用CPU模式大概为15-20分钟）

这里写图片描述
从图中可以看出，最后的训练分类准确率为99.08%，最终训练的模型权值保存早examples/mnist/lenet_iter_10000.caffemodel文件中训练状态则保存在examples/mnist/lenet_iter_10000.solverstate文件中。这两个文件都是ProtoBuffer二进制格式文件。