我们手中有的一般都是图片数据,jpg、bmp格式等,但caffe常使用的数据是db格式(leveldb/lmdb),因此首先我们要将自己数据转换成caffe可运行的格式文件。别捉鸡,caffe有给我们提供工具。根目录的tools文件下convert_imageset.cpp,经编译生成可执行文件,存放于./build/tools/文件,这个文件可帮我们将图片文件转换成db格式。
以分类任务为例,需要4个文件,train、train.txt、val、val.txt,train和val分别存放训练数据和测试数据,而两个txt文件分别是其文件的lable。
我们可以创建一个sh脚本来执行所有的操作。(以下操作均在/path to/caffe-master/路径下)
sudo vim data/mydata/create_lmdb.sh(我的数据放在data文件下的mydata目录下)
创建好脚本文件后即在里面写入代码:
#! /usr/bin/env sh
DATA = data/m