对于小规模样本集,常用的非配比例是trianing set/dev set/test set 6:2:2.例如共有10000个样本,则训练集分为6000个样本,验证集为2000样本,测试集为2000样本.
对于大规模样本集,则dev/test set的比例会减小很多,因为验证(比较)模型性能和测试模型性能一定的样本规模就足够了.例如共有1000000个样本,则训练集分为9980000个样本,验证集分为10000个样本,测试集分为10000个样本.
一般来说:目标检测项目训练集与验证集的比例8:2即可,注意验证集必须与训练集的分布相似,若用相差较大的数据进行验证,将会影响模型最终的学习结果。