恢复中断的训练
来自官方文档
恢复训练时,Ultralytics YOLO 会加载上次保存模型的权重,并恢复优化器状态、学习率调度器和历时编号。这样,您就可以从上次中断的地方无缝地继续训练过程。
Ultralytics YOLO 您可以通过设置 resume 参数 True 在调用 train 方法的路径,并指定 .pt 文件,其中包含经过部分训练的模型权重。
from ultralytics import YOLO
# Load a model
model = YOLO('path/to/last.pt') # load a partially trained model
# Resume training
results = model.train(resume=True)
通过设置 resume=True,"… train 函数将使用存储在 "path/to/last.pt “文件中的状态,从中断处继续训练。如果 resume 参数被省略或设置为 False,”… train 功能将开始新的培训课程。
请记住,默认情况下,检查点会在每个纪元结束时保存,或者使用 save_period 参数,因此您必须至少完成一个纪元才能恢复训练运行。
在第三轮结束时终止后执行上述命令在第四轮开始重新训练
RuntimeError: DataLoader worker (pid(s) 22440) exited unexpectedly
将batch调小,把workers=0
AttributeError: ‘NoneType’ object has no attribute ‘_free_weak_ref’
使用AutoDL云服务器时发现训练结束出现一堆这个东西,查了查资料发现是pytorch1.11的通病,官方解释在这
大概意思就是降级成1.10就解决啦,往上升还没试过。