断点训练
设第一次训练的epoch为1,在output文件下自动保存断点,
下次执行,如果epoch仍未1,则会自动加载output文件输出eval数据集的结果
下次执行,如果epoch大于1,则会自动加载output文件中的断点,继续fine-tuning训练,所以只要设置大于初始训练的epoch,增量训练epoch就为当下的epoch-初始的epoch次数。
因此重新训练需要删除output中的数据。
增量训练
原始样本x1,训练得到模型,保存在output中
新样本x1+x2,在原先output的基础上继续训练,但bert保存的ckpt模型是根据步来的,所以没法完整的增加几个epoch训练,就算设置和原始样本一样的epoch,还是可以训练多少步