caffe-windows 配置和cifar10数据集训练

最新推荐文章于 2024-08-03 10:47:10 发布

最新推荐文章于 2024-08-03 10:47:10 发布

分类专栏：机器学习文章标签：深度学习开源架构 opencv

convert_cifar_data.exe input output leveldb
pause

compute_image_mean.exe --backend=leveldb output/cifar10_train_leveldb mean.binaryproto
pause

caffe.exe train --solver=examples\cifar10\cifar10_quick_solver.prototxt  
pause

classification.exe examples\cifar10\cifar10_quick.prototxt examples\cifar10\cifar10_quick_iter_4000.caffemodel examples\cifar10\mean.binaryproto my.txt 3.jpg
pause

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

caffe-windows 配置和cifar10数据集训练

之前的文章中已经使得OpenCV能利用训练好的分类器进行图像的分类了，但最为关键的一步还没做，那便是分类器的获得。毕竟我们不可能用别人训练好的分类器很好的解决自己工程上的问题。

本篇，将开始对分类器的探索！

本人选用的是开源世界现在最流行的深度学习架构，至于为何怎么选，因为看到别人都这么选。。至于别的会不会更好，以后再说吧，有更深入的研究会跟大家分享。

caffe-windows下载地址： https://github.com/BVLC/caffe/tree/windows

注意这里不是直接下载源码，而是拉到页面下方如图所示位置下载：

下完解压，路径中不要有中文（一般都不要有中文，毕竟是外国人写的，支持可能不好，那就是个大坑），我们需要的东西都在“caffe/bin”这个路径里，后面也会经常用到。

下面就直接用caffe来为“cifar-10”这个很火的图像库生成分类器吧（其实我是想生成“cifar-100”这个图形库的分类器的，只是总有问题，后面再解决吧）。下载地址如下：

http://www.cs.toronto.edu/~kriz/cifar.html

生成步骤：

1.格式转换（下载的cifar-10是二进制文件，caffe无法直接处理，故有此步）

“cifar-10”下载后解压缩，把里面“.bin”后缀的文件拷贝到“caffe\bin\input（自己创建一个input文件夹）”中，然后再创建一个“output”文件夹来存放中间文件。

接着，在“caffe\bin”路径下创建一个bat文件，内容如下：

这里的“convert_cifar_data.exe”是我们下载的caffe里面就有的，而“input ”、“output ”为两个文件夹，“leveldb”为转换格式。

双击运行bat，不出意外在“output”文件夹下会生成“cifar10_test_leveldb”和“cifar10_train_leveldb”两个文件夹。

上面我们就完成了对于“cifar-10”这个图片库的格式转换工作，将下载的二进制文件转换为leveldb格式（caffe本身只支持leveldb和lmdb两种数据格式）。

2.求数据图像的均值,获取“mean.binaryproto”均值文件

在“caffe\bin”路径下创建一个bat文件，内容如下：

这里的“compute_image_mean.exe”是我们下载的caffe里面就有的，“output/cifar10_train_leveldb”为刚刚生成的文件夹路径，“mean.binaryproto”为生成文件名。

双击运行bat，在“caffe\bin”路径下会生成“mean.binaryproto”。如下图：

3.分类器训练

经过上面的努力，我们已经有了leveldb数据、均值文件，可以直接搞训练啦！

这里会用到“examples\cifar10”里面的“cifar10_quick_train_test.prototxt”和“cifar10_quick_solver.prototxt”两个文件，且两个文件都有地方要修改。

“cifar10_quick_train_test.prototxt”：是训练网络配置文件，用来设置训练用的网络，这个文件的名字会在“solver.prototxt”里指定，里面有四个路径，如下：

“cifar10_quick_solver.prototxt”：是方案配置文件，用于配置迭代次数等信息，训练时直接调用caffe train指定这个文件，就会开始训练把文件最后一行的”GPU”改成”CPU”,因为我们下的是CPU版本的caffe。

到此就搞定了，真不容易！下面我们再在“caffe\bin”这个路径中弄个bat文件，把分类器学习的命令放进去来双击就行，内容如下：

这里还有一个细节。。examples/cifar10/中有几种不同的训练模式（quick和full等），要一一对应。我们利用的是“cifar10_quick_trian_test.prototxt”网络结构，所以在solver中选择“cifar10_quick_solver.prototxt”。

假如你选择的网络是“cifar10_full_train_test.prototxt”，那么你的slver应为“cifar10_full_solver.prototxt”，上面要修改的两个文件也需要做相应的变化。

接下来，运行吧！

用CPU版本运行需要一段时间，具体多久我没计算，反正我是去看电视去了，回来就好了，可以从命令行中看到训练的精确度，训练完成之后会在“examples\cifar10”这个路径下生成如下两个文件：

前者是分类器描述文件，后者是继续学习会用到的文件。

另外，还会生成一个分类网络文件如下：

到此，我们就可以用“cifar10_quick_iter_4000.caffemodel”、“cifar10_quick.prototxt”和之前下载的“cifar-10”文件包中的“batches.meta.txt”来给图片进行分类了！

简单的可以用caffe自带的工具进行分类，注意“batches.meta.txt”里面最后不能有空行，不然会报错。我改成”my.txt”,然后通过如下内容的bat文件运行，检测一张小狗的图像。

运行结果如下：

可以看到其输出的结果还是准确的。

同样也可以参照之前的文章，用OpenCV进行分类，不过有个大坑！有个大坑！有个大坑！那就是要把“cifar10_quick.prototxt”文件中第一个层如下：

改写成如下形式：

不然会报错！不然会报错！不然会报错！不要问我为什么知道，现在想想都恶心、发晕、心有余悸。

不过opencv识别的结果跟自带的程序不一样，这个不科学，但本人现在还不太了解情况，不知道怎么解决。

本人的电脑的显卡是GTX960，因此的话是可以用CUDA做上面的分类器生成工作的。只有下载caffe带cuda的版本，如下：

然后把之前“cifar10_quick_solver.prototxt”文件最后一行重新改为”GPU”即可。其他的操作没有区别，弄完生成分类器，会发现速度快了非常的多，英伟达万岁！生成的窗口如下：

可以见到精确度经过训练不断的提升，4000次的训练后精确度为69.9%。

另外因为可以快速训练，比较容易发现，每次训练的精确度似乎都不大一样，如下是我完全没改内容做的另一次训练。

这是caffe算法会在测试数据中随机选一部分数据进行测试造成的。

为了提高精确度，可以修改“cifar10_quick_solver.prototxt”文件中的如下两处：

前者是迭代次数为4000，后者是每4000次迭代存储一次，和存储的路径。我改成10000，结果如下：

精确度提升了一点点。

精确度看起来是提升了，但用来分类自己的图像还是会失败，这个还未详细研究，这篇就先这样吧。

demo下载地址：http://download.csdn.net/download/ohantanyanying/9835752

参考文章：

http://blog.csdn.net/u012878523/article/details/41308333

http://www.cnblogs.com/king-lps/p/6606966.html

http://blog.csdn.net/hyqsong/article/details/51713444

　　之前的文章中已经使得OpenCV能利用训练好的分类器进行图像的分类了，但最为关键的一步还没做，那便是分类器的获得。毕竟我们不可能用别人训练好的分类器很好的解决自己工程上的问题。

　　本篇，将开始对分类器的探索！

　　本人选用的是开源世界现在最流行的深度学习架构，至于为何怎么选，因为看到别人都这么选。。至于别的会不会更好，以后再说吧，有更深入的研究会跟大家分享。

　　caffe-windows下载地址： https://github.com/BVLC/caffe/tree/windows

　　注意这里不是直接下载源码，而是拉到页面下方如图所示位置下载：

　　下完解压，路径中不要有中文（一般都不要有中文，毕竟是外国人写的，支持可能不好，那就是个大坑），我们需要的东西都在“caffe/bin”这个路径里，后面也会经常用到。

　　下面就直接用caffe来为“cifar-10”这个很火的图像库生成分类器吧（其实我是想生成“cifar-100”这个图形库的分类器的，只是总有问题，后面再解决吧）。下载地址如下：

　　http://www.cs.toronto.edu/~kriz/cifar.html

　　生成步骤：

　　1.格式转换（下载的cifar-10是二进制文件，caffe无法直接处理，故有此步）

　　“cifar-10”下载后解压缩，把里面“.bin”后缀的文件拷贝到“caffe\bin\input（自己创建一个input文件夹）”中，然后再创建一个“output”文件夹来存放中间文件。

　　接着，在“caffe\bin”路径下创建一个bat文件，内容如下：

　　这里的“convert_cifar_data.exe”是我们下载的caffe里面就有的，而“input ”、“output ”为两个文件夹，“leveldb”为转换格式。

　　双击运行bat，不出意外在“output”文件夹下会生成“cifar10_test_leveldb”和“cifar10_train_leveldb”两个文件夹。

　　上面我们就完成了对于“cifar-10”这个图片库的格式转换工作，将下载的二进制文件转换为leveldb格式（caffe本身只支持leveldb和lmdb两种数据格式）。

　　2.求数据图像的均值,获取“mean.binaryproto”均值文件

　　在“caffe\bin”路径下创建一个bat文件，内容如下：

　　这里的“compute_image_mean.exe”是我们下载的caffe里面就有的，“output/cifar10_train_leveldb”为刚刚生成的文件夹路径，“mean.binaryproto”为生成文件名。

　　双击运行bat，在“caffe\bin”路径下会生成“mean.binaryproto”。如下图：

　　3.分类器训练

　　经过上面的努力，我们已经有了leveldb数据、均值文件，可以直接搞训练啦！

　　这里会用到“examples\cifar10”里面的“cifar10_quick_train_test.prototxt”和“cifar10_quick_solver.prototxt”两个文件，且两个文件都有地方要修改。

　　“cifar10_quick_train_test.prototxt”：是训练网络配置文件，用来设置训练用的网络，这个文件的名字会在“solver.prototxt”里指定，里面有四个路径，如下：

　　“cifar10_quick_solver.prototxt”：是方案配置文件，用于配置迭代次数等信息，训练时直接调用caffe train指定这个文件，就会开始训练把文件最后一行的”GPU”改成”CPU”,因为我们下的是CPU版本的caffe。

　　到此就搞定了，真不容易！下面我们再在“caffe\bin”这个路径中弄个bat文件，把分类器学习的命令放进去来双击就行，内容如下：

　　这里还有一个细节。。examples/cifar10/中有几种不同的训练模式（quick和full等），要一一对应。我们利用的是“cifar10_quick_trian_test.prototxt”网络结构，所以在solver中选择“cifar10_quick_solver.prototxt”。

　　假如你选择的网络是“cifar10_full_train_test.prototxt”，那么你的slver应为“cifar10_full_solver.prototxt”，上面要修改的两个文件也需要做相应的变化。

　　接下来，运行吧！

　　用CPU版本运行需要一段时间，具体多久我没计算，反正我是去看电视去了，回来就好了，可以从命令行中看到训练的精确度，训练完成之后会在“examples\cifar10”这个路径下生成如下两个文件：

　　前者是分类器描述文件，后者是继续学习会用到的文件。

　　另外，还会生成一个分类网络文件如下：

　　到此，我们就可以用“cifar10_quick_iter_4000.caffemodel”、“cifar10_quick.prototxt”和之前下载的“cifar-10”文件包中的“batches.meta.txt”来给图片进行分类了！

　　简单的可以用caffe自带的工具进行分类，注意“batches.meta.txt”里面最后不能有空行，不然会报错。我改成”my.txt”,然后通过如下内容的bat文件运行，检测一张小狗的图像。

　　运行结果如下：

　　可以看到其输出的结果还是准确的。

　　同样也可以参照之前的文章，用OpenCV进行分类，不过有个大坑！有个大坑！有个大坑！那就是要把“cifar10_quick.prototxt”文件中第一个层如下：

　　改写成如下形式：

　　不然会报错！不然会报错！不然会报错！不要问我为什么知道，现在想想都恶心、发晕、心有余悸。

　　不过opencv识别的结果跟自带的程序不一样，这个不科学，但本人现在还不太了解情况，不知道怎么解决。

　　本人的电脑的显卡是GTX960，因此的话是可以用CUDA做上面的分类器生成工作的。只有下载caffe带cuda的版本，如下：

　　然后把之前“cifar10_quick_solver.prototxt”文件最后一行重新改为”GPU”即可。其他的操作没有区别，弄完生成分类器，会发现速度快了非常的多，英伟达万岁！生成的窗口如下：

　　可以见到精确度经过训练不断的提升，4000次的训练后精确度为69.9%。

　　另外因为可以快速训练，比较容易发现，每次训练的精确度似乎都不大一样，如下是我完全没改内容做的另一次训练。

　　这是caffe算法会在测试数据中随机选一部分数据进行测试造成的。

　　为了提高精确度，可以修改“cifar10_quick_solver.prototxt”文件中的如下两处：

　　前者是迭代次数为4000，后者是每4000次迭代存储一次，和存储的路径。我改成10000，结果如下：

　　精确度提升了一点点。

　　精确度看起来是提升了，但用来分类自己的图像还是会失败，这个还未详细研究，这篇就先这样吧。

　　demo下载地址：http://download.csdn.net/download/ohantanyanying/9835752

　　参考文章：

　　http://blog.csdn.net/u012878523/article/details/41308333

　　http://www.cnblogs.com/king-lps/p/6606966.html

　　http://blog.csdn.net/hyqsong/article/details/51713444