《深度学习——实战caffe》——运行手写体数字识别

最新推荐文章于 2024-07-25 22:29:57 发布

频率52HZ

最新推荐文章于 2024-07-25 22:29:57 发布

阅读量989

点赞数

分类专栏：深度学习文章标签： Mnist caffe

深度学习专栏收录该内容

101 篇文章 3 订阅

订阅专栏

数据集背景：

MNIST 是一个大型的手写体数字数据库，广泛应用于机器学习领域的训练和测试，由纽约大学Yann LeCun教授整理。

MNIST包括60000个训练集和10000测试集，图片固定尺寸为28*28。

LeNet模型背景：

LeNet是1986提出的，是最简单的CNN（卷积神经网路）模型，也是Caffe自带的第一个小例子用到模型。

所以综上，不难看出【在MNIST手写体数据集上用Caffe框架训练LeNet模型】简直就是深度学习届的helloworld啊哈哈哈

废话说完，看下Caffe官方给出的第一个小例子是怎么跑起来的。

第一步：下载MNIST数据集

大Caffe已经给我们写好了下载脚本，直接执行就是：

1	`sudo` `sh data` `/mnist/get_mnist` `.sh`

当然可以用Vim打开看一下啦，主要是一些wget下载命令和gunzip解压命令啦O(∩_∩)O~

运行成功后，在 data/mnist/目录下多出了四个文件，这四个文件便是MNIST原始数据文件啦。

train-images-idx3-ubyte: 训练集样本 (9912422 bytes)

train-labels-idx1-ubyte: 训练集对应标注 (28881 bytes)

t10k-images-idx3-ubyte: 测试集图片 (1648877 bytes)

t10k-labels-idx1-ubyte: 测试集对应标注 (4542 bytes)

第二步：数据格式转换

当然上面的原始数据格式为二进制文件，是不能在caffe中直接使用的，需要转换成Caffe可以识别的格式LMDB或者LEVELDB才行。

继续执行脚本咯：

1	`sudo` `sh examples` `/mnist/create_mnist` `.sh`

如果想运行leveldb数据，请运行 examples/siamese/ 文件夹下面的程序，examples/mnist/ 文件夹是运行lmdb数据。两个都可以，反正当初在搭建环境的时候，这两个依赖包都安装过了。转换成功后，会在 examples/mnist/目录下，生成两个文件夹，分别是mnist_train_lmdb（训练集）和mnist_test_lmdb（测试集），里面存放的data.mdb和lock.mdb，就是我们需要的运行数据。

PS：至于为什么不直接读取原始数据，非要采用LMDB、LEVELDB呢？主要有两个原因：

1、原始数据类型多种多样，不可能用一套代码来搞定，转换是为了更好的统一，以简化读取层的实现；

2、使用LMDB、LEVELDB可以提高磁盘IO利用率。

第三步：开始训练模型

一切准备就绪后，开始训练。依然范特。。不对，依然脚本伺候：

1	`sudo` `sh examples` `/mnist/train_lenet` `.sh`

等下，本宝热爱学习，我想看下脚本里面写的什么，用vi打开后发现：

1 2	`#！/usr/bin/env sh` `.` `/build/tools/caffe` `train --solver=examples` `/mnist/lenet_solver` `.prototxt`

可见啊，该脚本是调用了前面编译好的build/tools/caffe.bin二进制文件，参数--solver=examples/mnist/lenet_solver.prototxt 则是指定了训练超参数文件文件。

打开它：

 
      # The train/test net protocol buffer definition   // 参数描述文件 
     
      net:  
      "examples/mnist/lenet_train_test.prototxt"    
      // 
      位置 
     
      # test_iter specifies how many forward passes the test should carry out.  
     
      # In the case of MNIST, we have test batch size 100 and 100 test iterations, 
     
      # covering the full 10,000 testing images. // 一共10000张测试图像，test batch size 100 每次测试处理100张 
     
      test_iter: 100   
      //  
      进行100次前向计算，test_iter* 
      test  
      batch size =10000 
     
      # Carry out testing every 500 training iterations. 
     
      test_interval: 500  
      //  
      每训练500次，进行一次测试 
     
      # The base learning rate, momentum and the weight decay of the network. 
     
      base_lr: 0.01   
      // 
      基础学习率 
     
      momentum: 0.9   
      // 
      学习率 改变的动量 
     
      weight_decay: 0.0005  
      // 
      学习率衰减系数 
     
      # The learning rate policy  //学习策略 及相关参数 
     
      lr_policy:  
      "inv" 
     
      gamma: 0.0001 
     
      power: 0.75 
     
      # Display every 100 iterations 
     
      display: 100    
      // 
      迭代100次 打印输出一次结果 
     
      # The maximum number of iterations 
     
      max_iter: 10000    
      // 
      最大迭代数 
     
      # snapshot intermediate results 
     
      snapshot: 5000      
      //5000 
      次迭代保存一次临时模型，名称为lenet_iter_5000.caffemodel 
     
      snapshot_prefix:  
      "examples/mnist/lenet" 
     
      # solver mode: CPU or GPU // 使用CPU还是GPU 
     
      solver_mode: GPU    
      // 
      打开GPU

根据参数的意思再结合自己的情况，修改之。尤其是最后一句，如果没有显卡就老老实实的修改成CPU模式吧。

终于可以训练了，好鸡动：

1	`sudo` `sh examples` `/mnist/train_lenet` `.sh`

大概20分钟吧，时间会给你好味道O(∩_∩)O~

第四步：用训练好的模型对数据进行预测

最终训练好的模型的权值保存在 examples/mnist/lenet_iter_10000.caffemodel 文件中，训练状态保存在 examples/mnist/lenet_iter_10000.solverstate 文件中。

下面开始利用训练好的LeNet模型权值文件对测试集进行预测：

1

2

3

4

 
      . 
      /build/tools/caffe  
      test  
     
      -model examples 
      /mnist/lenet_train_test 
      .prototxt  
     
      -weights examples 
      /mnist/lenet_iter_10000 
      .caffemodel  
     
      -iterations 100

OK，静等实验结果吧，最终识别率为99%。

总结：通过跑Caffe自带的这个小例子让我大致了解了Caffe的工作流程。

频率52HZ

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
《深度学习——实战caffe》——运行手写体数字识别

数据集背景：MNIST 是一个大型的手写体数字数据库，广泛应用于机器学习领域的训练和测试，由纽约大学Yann LeCun教授整理。MNIST包括60000个训练集和10000测试集，图片固定尺寸为28*28。LeNet模型背景：LeNet是1986提出的，是最简单的CNN（卷积神经网路）模型，也是Caffe自带的第一个小例子用到模型。所以综上，不难看出【在MNIST手写体数据集上用Caffe框架训...
复制链接

扫一扫

专栏目录