将单个数据集拆分为一个训练集和一个测试集。 确保您的测试集满足以下两个条件: 规模足够大,可产生具有统计意义的结果。能代表整个数据集。换言之,挑选的测试集的特征应该与训练集的特征相同。 测试集切勿加入到训练集,否则会产生迷惑人的准确率,这时是不准确的。