checkpoint 是什么?
运行代码的时候出现了下面一行信息
2024-04-10 17:30:53,264 - mmdet - INFO - Saving checkpoint at 8 epochs
然后文件中增加了epoch_8.pth文件。
在深度学习训练过程中,checkpoint
通常是指训练过程中的一个特定状态的保存文件,它包含了模型权重、训练进度等信息。当你看到类似Saving checkpoint at 8 epochs
这样的信息时,就表明在训练的第8个epoch结束后,程序自动保存了这个时刻的模型状态。
epoch_8.pth
就是这个在第8个epoch结束时保存的checkpoint文件。
"checkpoint"并不是指一个具体的文件或文件夹名,而是指在训练过程中保存的模型状态。具体来说,"Saving checkpoint at 8 epochs"意味着在训练的第8个epoch结束时,程序自动保存了这个时刻模型的权重和状态。这样做是为了在后续的训练过程中,如果需要中断或重启训练,可以直接从这个checkpoint开始,而不必从头开始训练,这样可以大大节省时间和资源。