将自己的图像数据转换成caffe需要的db(leveldb/lmdb)文件
在搭建好caffe环境之后,我们往往需要对自己的图像数据进行训练/测试,我们的图像数据往往时图片文件,如jpg,jpeg,png等,然而在caffe中我们需要使用的数据类型是lmdb或leveldb,例如:在之前测试MNIST数据集《 深度学习文章2:使用MNIST数据集验证Caffe是否安装成功 》时,我们运行脚本create_mnist.sh就是生成对应的db文件,运行后在~/caffe/examples/mnist/mnist_train_lmdb目录下,可以看到生成的db文件:
因此我们在对自己的图像数据进行训练/测试之前,需要转换成caffe框架可以直接使用的db文件,本篇博文主要就如何转换进行详细阐释。
1.创建图片清单文件
首先我们需要创建一个我们自己图片数据集的清单txt文件,这里我们先以caffe自带的两张图片为例,在caffe目录/examples/images下,有两张cat.jpg和fish-bike.jps,我们将这两张图片分别作为类别1和类别2。然后我们需要创建一个sh脚本文件来生成图片清单:
cd ~/caffe/
sudo gedit examples/images/create_filelist.sh
将以下内容编辑在文件中:
DATA=examples/images
echo "Create train.txt..."
rm -rf $DATA/train.txt
find $DATA -name *cat.jpg | cut -d '/' -f3 | sed "s/$/ 1/">>$DATA/train.txt
find $DATA -name *bike.jpg | cut -d '/' -f3 | sed "s/$/ 2/">>$DATA/tmp.txt
cat $DATA/tmp.txt>>$DATA/train.txt
rm