一、 准备数据集
可以下载我的练习数据:http://pan.baidu.com/s/1MotUe,放在data/re根目录下。
这些数据共有500张图片,400张用于训练,100张用于测试。分为大巴车、恐龙、大象、鲜花和马五个类,每个类100张。
在examples/根目录下新建文件夹 mydata1,在此文件夹内放入训练集、测试集等相关文件。
1. 训练集
1)创建训练集
在examples/mydata1根目录下,新建imgtrainset文件夹 和 train.txt 文本文件
(注意: txt文件内,类别必须从0开始标注,不能从3开始)
2)利用caffe现成的convert_imageset程序,把训练集从img格式转换成lmdb格式(需要归一到相同尺寸227*227),并且gray为false(caffenet网络模型输入的是三通道图片),并且需要打乱数据集(不能全0后面跟全1,再跟全2,以此类推),所以一定要加shuffle=true,不然训练的时候会出错(loss会很大)
新建convert_image_traindata.bat,内容如下:
SET GLOG_logtostderr=1
E:\study_materials\Caffe\caffe-master\caffe-master\Build\x64\Release\convert_imageset.exe imgtrainset/ train.txt train_modelre_lmdb -resize_width=227 -resize_height=227--backend=lmdb --gray=false--shuffle=true