在进行caffe训练前需要生成train.txt文件,caffe图像分类训练流程见博客,本文提供了另外一种生成txt文件的命令流。
#!/usr/bin/env sh
DATA=examples/myfile4/data #数据来源的路径
MY=examples/myfile4/data #生成的txt文件存储位置
echo "Create train.txt..."
rm -rf $MY/train.txt #先把文件中原有的同名文件删除
find $DATA/train -name 00000*.jpg | cut -d '/' -f4-5 | sed "s/$/ 0/">>$MY/train.txt
find $DATA/train -name 00001*.jpg | cut -d '/' -f4-5 | sed "s/$/ 1/">>$MY/train.txt
find $DATA/train -name 00002*.jpg | cut -d '/' -f4-5 | sed "s/$/ 2/">>$MY/train.txt
find $DATA/train -name 00003*.jpg | cut -d '/' -f4-5 | sed "s/$/ 3/">>$MY/train.txt
find $DATA/train -name 00004*.jpg | cut -d '/' -f4-5 | sed "s/$/ 4/">>$MY/train.txt
find $DATA/train -name 00005*.jpg | cut -d '/' -f4-5 | sed "s/$/ 5/">>$MY/train.txt
echo "Create val.txt..."
rm -rf $MY/val.txt
find $DATA/val -name 00000*.jpg | cut -d '/' -f4-5 | sed "s/$/ 0/">>$MY/val.txt
find $DATA/val -name 00001*.jpg | cut -d '/' -f4-5 | sed "s/$/ 1/">>$MY/val.txt
find $DATA/val -name 00002*.jpg | cut -d '/' -f4-5 | sed "s/$/ 2/">>$MY/val.txt
find $DATA/val -name 00003*.jpg | cut -d '/' -f4-5 | sed "s/$/ 3/">>$MY/val.txt
find $DATA/val -name 00004*.jpg | cut -d '/' -f4-5 | sed "s/$/ 4/">>$MY/val.txt
find $DATA/val -name 00005*.jpg | cut -d '/' -f4-5 | sed "s/$/ 5/">>$MY/val.txt
echo "All done"
- find:$DATA/val表示数据来源的路径文件夹
- name:其中15001、15059等表示图片名称前缀,初始命名时表示某类
- cut -d ‘/’ -f4-5:表示先按符号“/”分段,分段后结果中,-f 表示取第几个字段
- 例子:
其中例如一个图片的绝对路径为‘/home/ww/xc/newbuild/train/00001_0.696860780225.jpg’
-f1 在.txt文件中显示 0
-f3-4 在.txt中显示 ww/xc 0
-f6-7 在.txt中显示 train/00001_0.683245042607.jpg 0
因此-f后面数字如何确定基本应该清楚了,第一个符号“/”前定位符为1。