权重问题和训练集、验证集、测试集

鱼儿会飞吗

于 2024-09-17 16:13:49 发布

阅读量268

点赞数 3

文章标签： python 人工智能深度学习

本文链接：https://blog.csdn.net/qq_34425255/article/details/142315666

版权

best.pt和last.pt都是yolo模型的训练权重文件，区别在于：
best.pt：保存的是训练过程中在验证集上表现最好的模型权重。在训练过程中，每个epoch结束后都会对验证集进行一次评估，并记录下表现最好的模型的权重。这个文件通常用于推理和部署阶段，因为它包含了在验证集上表现最好的模型的权重，可以获得最佳的性能。
last.pt：保存的是最后一次训练迭代结束后的模型权重。这个文件通常用于继续训练模型，因为它包含了最后一次训练迭代结束时的模型权重，可以继续从上一次训练结束的地方继续训练模型。
使用上的区别是，当需要在之前的训练基础上继续训练时，应该使用last.pt作为起点进行训练；当需要使用训练后的模型进行推理和部署时，应该使用best.pt。

首先，解释一下为什么需要测试集。简单来说，如果没有测试集我们就没有办法提前知道训练出来的模型应用于目标场景时效果会怎么样。当然了，如果直接部署到使用场景看实际效果，这也是一种online测试的方法，只有在模型犯错后果不严重时才能这么做。很多时候，模型犯错的结果是我们不能接受的，这就需要我们能够提前评估出模型的实际效果。比如，医疗、航空航天，以及一些商业领域试错的成本都是很高的。

那么，很多小伙伴可能要问，在训练集上的评测结果难道不能代表模型部署到实际使用场景的效果吗？还真不能，因为模型训练的过程很容易过拟合，也就是说模型可能学到了一些在特定训练集上的“噪声”pattern，这些“噪声”pattern在实际的使用场景会干扰模型的预测结果。如果没有测试集或验证集，我们将无法得知模型是否过拟合了。

其次，解释一下为什么需要验证集。验证集是为了选择模型的超参数用的。不同的超参数训练出来的模型效果也不同，那么那组超参数更好呢？这就需要一个验证集来评估在不同超参数下训练出来的模型的效果。最后，选择效果最好的那组超参数。

这里可能又会有人问了，不能直接使用测试集来选择超参数吗？严格来说，最好不要。因为多次实验选择在验证集上效果最好的模型这一过程可能也会发生“过拟合”现象。