在根目录下的tools文件夹下,提供了文件:convert_imageset。文件的作用是用于将图片文件转换成caffe框架中能直接使用的db文件。
文件使用格式:
convert_imageset [FLAGS] ROOTFOLDER/ LISTFILE DB_NAME
需要带4个参数:
FLAGS:图片参数组
ROOTFOLDER/:图片存放的绝对路径,从根目录开始
LISTFILE:图片文件列表清单,一般为一个txt文件,一行一张照片
DB_NAME:最终生成的db文件存放目录
如果图片已经下载到本地,那么首先需要创建一个列表清单,保存为txt。
以下以caffe中自带的图片为例,创建脚本生成train.txt文件
sudo vi examples/images/create_lmdb.sh
# /usr/bin/env sh
DATA=examples/images
echo "Create train.txt..."
rm -rf $DATA/train.txt
find $DATA -name *cat.jpg | cut -d '/' -f3 | sed "s/$/ 1/">>$DATA/train.txt
find $DATA -name *bike.jpg | cut -d '/' -f3 | sed "s/$/ 2/">>$DATA/tmp.txt
cat $DATA/tmp.txt>>$DATA/train.txt
rm -rf $DATA/tmp.txt
echo "Done.."
接下来了解FLAGS这个参数组:
-gray:是否以灰度图的方式打开图片。程序调用opencv中的imread打开图片,默认false。
-shuffle:是否随机打乱图片顺序。默认为false。
-backend:需要转换成的db文件格式,可选为leveldb或lmdb,默认后者。
-resize_width/resize_height:改变图片的大小。
-check_size:检测所有的数据是否有相同的尺寸。默认为false,不检查。
-encoded:是否将原图片编码放入最终的数据中,默认为false。
-encoded_type:与前一个参数对应,将图片编码为哪一个格式:png,jpg
接下来可以调用命令来生成lmdb格式数据:
创建脚本
sudo vi examples/images/create_lmdb.sh
代码为:
#!/usr/bin/en sh
DATA=examples/images
rm -rf $DATA/img_train_lmdb
build/tools/convert_imageset --shuffle \
--resize_height=256 --resize_width=256 \
/home/xxx/caffe/examples/images/ $DATA/train.txt $DATA/img_train_lmdb