训练/开发/测试集划分
开发集我们称之为development set,有时候也称之为保留交叉验证集。机器学习的流程是,你尝试很多的思想,然后用训练集训练不同的模型,使用开发集来评估不同的思路,选择一个,之后不断迭代去改善开发集的性能,直到最后你可以得到一个令你满意的成本,之后用测试集去评估。
数据集和测试集的划分一个非常非常重要的原则就是一定满足同一分布。
如图所示,如果我们要8个不同国家,最好不要四个国家划分为一组,而是把数据全部打散,均匀的划分。
不要花很多时间来瞄准一个目标,针对靶心不断优化,然后等到测试的时候说,我们用其他靶来测试。