0.准备数据集
将每个类别的图片存放到对应的文件夹中,如下图所示。需要注意的是每个图片的名称不要有空格和括号,否则会导致生成lmdb文件的时候路径读入错误。
1.生成train.txt和test.txt
- train.txt:存的是训练集数据路径和类别
- test.txt:存的是测试集数据路径和类别
(1)生成绝对路径
利用如下的LoadAbsoluteName.py得到指定格式的(当前实例中的.jpg格式的图片)文件的绝对路径。该路径用于之后caffe训练数据集的生成。生成如下图所示的绝对路径。
#LoadAbsoluteName.py
#提取指定文件夹下对应格式文件的绝对路径
import os
def ListFilesToTxt(dir,file,wildcard,recursion,NeedAbsolutePath):
exts = wildcard.split(" ")
files = os.listdir(dir)
for name in files:
fullname = os.path.join(dir,name)
if(os.path.isdir(fullname) & recursion):
ListFilesToTxt(fullname,file,wildcard,recursion,NeedAbsolutePath)
else:
for ext in exts:
if (name.endswith(ext)):
if NeedAbsolutePath:
file.write(f