原来的训练代码如下:
#!/usr/bin/env sh
TOOLS=./build/tools
$TOOLS/caffe train \
--solver=examples/cifar10/cifar10_full_solver.prototxt
prototxt中设置每10000次保存一下当前训练状态和模型:
# snapshot intermediate results
snapshot: 10000
如果在训练的过程中不小心中断了,那么下次在这个基础上恢复的代码如下:
$TOOLS/caffe train \
--solver=examples/cifar10/cifar10_full_solver.prototxt \
--snapshot=examples/cifar10/cifar10_full_iter_10000.solverstate