一、小数据划分原则
对于100、1000、10000个样本规模的数据集划分原则:
70%训练集,30%测试集
二、大规模数据集划分原则
对于百万级样本规模的数据集:
98%训练集,1%验证集和1%测试集
三、test set是用来衡量模型的好坏程度,对于大数据集来说,10000个测试集样本足够衡量模型
一、小数据划分原则
对于100、1000、10000个样本规模的数据集划分原则:
70%训练集,30%测试集
二、大规模数据集划分原则
对于百万级样本规模的数据集:
98%训练集,1%验证集和1%测试集
三、test set是用来衡量模型的好坏程度,对于大数据集来说,10000个测试集样本足够衡量模型