测试集为什么不能当做验证集使用？

温柔的行子

已于 2023-11-20 15:11:31 修改

阅读量1.4k

点赞数 7

文章标签：机器学习人工智能

于 2023-11-20 11:52:25 首次发布

本文链接：https://blog.csdn.net/qq_42536162/article/details/134504541

版权

测试集和验证集在机器学习中有不同的目的和用途，因此通常不应该混用。主要的原因包括：

测试集的独立性： 测试集的主要目的是评估模型在未见过的数据上的泛化性能，模型在测试集上的表现应该反映其在实际应用中的性能。如果测试集被用作验证集，模型就可能在训练和调整过程中“看到”这部分数据，导致对泛化性能的估计过于乐观。
防止过拟合验证集： 在模型的调整和超参数选择中，验证集用于评估模型的性能。如果测试集同时用于验证，模型可能会在训练过程中针对验证集过度拟合，导致对模型性能的不准确估计。
模型泄露的风险： 在模型的开发过程中，经常会进行多次调整和优化。如果每次都使用相同的测试集作为验证集，可能会导致模型对测试集的过度拟合，最终无法准确评估其性能。

建议的做法：

总之，为了得到对模型性能的可靠评估，测试集和验证集应该保持独立，测试集仅用于最终评估模型的泛化性能。

典型的使用顺序：

训练集： 用于训练模型。（选择超参数、进行模型选择、进行早停（early stopping）等）
验证集： 模型训练后，使用验证集来测试这个超参数下的模型性能。验证集的性能指标用于调整模型超参。
测试集： 最终，在模型调优（超参调优和可学习参数调优）完成后，使用测试集来评估模型在未见过的数据上的性能。测试集的使用应该在模型的开发周期的最后阶段，以保持测试的独立性。
测试集是在模型训练和验证完成后才使用的，用于评估模型的泛化能力。