博主目前刚刚入坑Deep Learning,本文也学习笔记,仅供参考学习,欢迎交流指正。
我们首先来看看,一个完整的Caffe模型中有哪些必要的文件。(github上文件太多,显得有些乱,吐槽下)
跑过Caffe例程或者自习finetune过模型的朋友应该比较熟悉,这里以例程mnist的Lenet模型为例,方便大家查看。
主要文件
①lenet_train_test.prototxt:这个文件定义了Lenet的整个网络结构参数,每一层之间的关系,不熟悉prototxt的同学可自行百度。如果需要修改网络或者定义自己的网络结构,只需要修改这个文件即可。
②lenet_solver.prototxt:这个文件是网络求解文件,定义了训练求解的参数,如学习率,是否使用GPU,使用SGD。这个文件主要在训练是调用。(这个文件有的地方好像存储为train.solver/test.solver格式,但内容是一样的,原因博主还未知)。
③train_lenet.sh:这个是Linux下可执行文件格式,训练时使用。该文件存储了一些路径信息,具体内容请自行查看。
好,到这里,我们就基本见过了一个模型的必要文件。
训练过程
我们再介绍一下Caffe的训练流程。
一、准备自己的数据,使用Caffe自带的文件转换自己的数据格式;
二、准备上述两个.prototxt文件,定义自己的网络格式以及模型参数;
三、然后使用Caffe目录下自带的tools,调用我们定义的solver参数,开始训练(也可以直接运行我们在③准备的.sh文件);
四、最后生成caffemodel格式的文件,它存储了我们模型的所以参数,如果需要finetune,可直接加载模型,再重新训练后几层即可。
补充:
上面提到训练时,直接调用train_lenet.sh,打开train_lenet.sh,我们发现里面的代码十分的短小,有价值的就一句话./build/tools/caffe train –solver=examples/mnist/lenet_solver.prototxt $@,也就是说,直接运行.sh文件与使用./build/tools/caffe train \
–solver=./examples/mnist/solver.prototxt***效果是一样的。