最近由于网络的原因,在用 cascade rcnn 训练一个大型数据集的时候,在epoch= 20 的时候中断训练了。如何继续上次的训练过程?
打开 train.py,如图:
也就是说,训练时,最后加一个–resume from 参数,然后后面跟上次训练生成的最后一个权重文件(.pth)就可以了。
因此,在命令行输入以下语句进行训练即可以完全相同的模型配置继续上次的训练啦:
python /home/wangzhenkuan/mmdetection/work_dirs/cascade-rcnn_r50_fpn_1x_coco.py --work-dir work_dirs --resume-from /home/wangzhenkuan/mmdetection/work_dirs/epoch_12.pth