上一篇博客介绍了如何在caffe框架平台下,用LeNet网络训练车牌识别数据,今天介绍用AlexNet跑自己的数据,同样基于windows平台下,会比基于Ubuntu平台下麻烦一些,特别是后面的Siamese网络,说起Siamese网络真是一把辛酸一把泪啊,先让我哭一会,,,,,哭了5分钟,算了,Siamese网络的苦水等以后再倒吧,言归正传,开始train。
在caffe平台下,实现用Alexnet跑自己的数据步骤和上一篇的步骤差不多,可以说几乎一样。。。。。
1、准备数据
在caffe根目录下data文件夹新建一个文件夹,名字自己起一个就行了,我起的名字是cloth,在cloth文件夹下新建两个文件夹,分别存放train和val数据,在train文件夹下存放要分类的数据,要分几类就建立几个文件夹,分别把对应的图像放进去。(当然,也可以把所有的图像都放在一个文件夹下,只是在标签文件中标明就行)。
然后建立train数据集对应的标签txt文件。同样,在val文件夹下存放验证数据,并建立验证图像对应的txt标签文件。
2、转换数据
编译成功的caffe根目录下bin文件夹下有一个convert_imageset.exe文件,用来转换数据,在cloth文件夹下新建一个脚本文件,内容:
mtrainldb和mvalldb分别是转化好的数据集文件,既caffe需要的文件。这样在cloth文件夹下会生成两个文件夹:
这里面存储的就是生成的数据文件。
3、计算均值
在cloth文件夹下新建一个计算均值的脚本文件,内容如下:
用到的computer_image_mean也是bin目录下生成的一个可执行文件,用来计算均值,mtrainldb是存放训练数据的文件夹,mimg_mean_binaryproto就是要生成的均值文件。双击运行后会生成mimg_mean_binaryproto文件,这个文件就是计算出来的均值文件。
4、开始训练
同样,在cloth文件夹下,新建一个train脚本文件,文件内容如下:
这个就不过多解释了吧,solver就是Alexnet的超参文件,打开后如下:
net: "train_val.prototxt" #需要用哪个网络训练
test_iter: 1000
test_interval: 1000
base_lr: 0.01 #初始化学习率
lr_policy: "step" #学习策略,每stepsize之后,将学习率乘以gamma
gamma: 0.1 #学习率变化因子
stepsize: 100000 #每stpesize之后降低学习率
display: 20
max_iter: 450000 #最大迭代次数
momentum: 0.9 #动量,上次参数更新的权重
weight_decay: 0.0005 #权重衰减量
snapshot: 10000 #每10000次保存一次模型结果
snapshot_prefix: "cloth" #模型保存路径
solver_mode: GPU #CPU或者GPU训练,这里使用CPU,所以需要把GPU改成CPU
打开train_val.prototxt,内容如下:
name: "AlexNet"
layer {
name: "data"
type: "Data"
top: "data"
top: "label"
include {
phase: TRAIN
}
transform_param {
mirror: true
crop_size: 227
mean_file: "mimg_mean.binaryproto" #均值文件
}
data_param {
source: "mtrainldb" #训练数据
batch_size: 256
backend: LMDB
}
}
layer {
name: "data"
type: "Data"
top: "data"
top: "label"
include {
phase: TEST
}
transform_param {
mirror: false
crop_size: 227
mean_file: "mimg_mean.binaryproto" #均值文件
}
data_param {
source: "mvaldb" #验证数据
batch_size: 50
backend: LMDB
}
}
layer {
name: "conv1"
type: "Convolution"
bottom: "data"
top: "conv1"
param {
lr_mult: 1
decay_mult: 1
}
param {
lr_mult: 2
decay_mult: 0
}
convolution_param {
num_output: 96
kernel_size: 11
stride: 4
weight_filler {
type: "gaussian"
std: 0.01
}
bias_filler {
type: "constant"
value: 0
}
}
}
layer {
name: "relu1"
type: "