caffe对于训练数据格式,支持:lmdb、hdf5……,其中lmdb数据格式常用于单标签数据,像分类等,经常使用lmdb的数据格式。对于回归等问题,或者多标签数据,一般使用h5py数据的格式。当然好像还有其它格式的数据可用,本文就主要针对lmdb数据格式的制作方法,进行简单讲解。
以一个简单的例子来介绍一下如何生成自己的图像集。主要分为两步:
(1)生成标签文件列表,即生成 .txt 文件
(2)将 txt 文件列表中的图像与train图像库、val图像库的图像相连接,生成lmdb格式文件
lmdb数据
train文件存放训练数据,val文件存放验证数据。然后我们在train文件下面,把训练数据包含人、不包含人图片各放在一个文件夹下面:
lmdb用于单标签数据。为了简单起见,我后面通过一个行人与非行人分类问题作为例子,进行相关数据制作讲解。
首先新建一个文件夹,本文命名为caffe_person_Detection,包含train、val文件夹。
1、数据准备
首先我们要准备好训练数据,然后新建一个名为train的文件夹和一个val的文件夹:
train文件存放训练数据,val文件存放验证数据。然后我们在train文件下面,把训练数据包含人、不包含人图片各放在一个文件夹下面:
同样的我们在val文件下面也创建文件夹:
两个文件也是分别存我们用于验证的图片数据包含人与不包含人图像文件。我们在train/person下面存放了都是包含人的图片,然后在val/person下面存放的都是验证数据包含人的图片。
2、标签文件.txt文件制作</