本教程用于从文件夹中读取训练数据(图片)并转换为caffe需要的mdb格式,随后将其用于后续的训练和测试。
一、原始数据
这里选用徐其华(
denny402)收集的数据,共有500张图片,分为大巴车、恐龙、大象、鲜花和马五个类,每个类100张。网盘地址为-
网盘地址。编号分别以3,4,5,6,7开头,各为一类。我从其中每类选出20张作为测试,其余80张作为训练。因此最终训练图片400张,测试图片100张,共5类。训练图片目录:re/train/ ,测试图片目录: re/test/,并将图片文件夹放置在caffe-master/examples中,完整的路径为/home/guoyu/caffe-master/examples/re。
二、生成标签文件
编写脚本:vim examples/re/get_labellist.sh
#!/usr/bin/env sh
DATA=examples/re/
echo "Create train.txt..."
rm -rf $DATA/train.txt #如果已存在该文件则移除,不存在的话就没影响
for i in 3 4 5 6 7
do
find $DATA/train -name $i*.jpg | cut -d '/' -f4-5 | sed "s/$/ $i/">>$DATA/train.txt #最终在该路径下生成标签文件
done
echo "Create test.txt..."
rm -rf $DATA/test.txt
for i in 3 4 5 6 7
do
find $DATA/test -name $i*.jpg | cut -d '/' -f4-5 | sed "s/$/ $i/">>$DATA/test.txt
done
echo "All done"
运行此脚本:
bash examples/re/get_labellist.sh
我们查看