训练集 | 验证集 | 测试集 | |
---|---|---|---|
功能 | 用来训练机器学习模型的数据集 | 用来调整机器学习模型的超参数(如学习率、正则化参数等)的数据集 | 在训练和验证后用于评估模型性能的数据集 |
规模 | 通常是数据集的大部分,可以包含成千上万的样本 | 验证集通常是从训练集中划分出来的,通常包含数百到数千个样本 | 测试集通常是从数据集中划分出来的,通常包含数百到数千个样本 |
来源划分 | 通过留出法、交叉验证法、自助法等方法来将数据集划分为训练集和验证集 | 可以是原始数据集中划分出来的;可以是外部真实数据集 |
训练集、验证集、测试集比较
于 2023-08-30 16:16:01 首次发布