将原始数据随机分为两组,一组做为训练集,一组做为验证集,利用训练集训练分类器,然后利用验证集验证模型,记录最后的分类准确率为此分类器的性能指标。训练集与测试集按比例划分,这个划分选取是随机的,并不是每次将顺序打乱,很次训练结果不一样有些人可能认为是数据的顺序被打乱了,其实不是的。
好处:
处理简单,只需随机把原始数据分为两组即可
坏处:
但没有达到交叉的思想,由于是随机的将原始数据分组,所以最后验证集分类准确率的高低与原始数据的分组有很大的关系,得到的结果并不具有说服性。
将原始数据随机分为两组,一组做为训练集,一组做为验证集,利用训练集训练分类器,然后利用验证集验证模型,记录最后的分类准确率为此分类器的性能指标。训练集与测试集按比例划分,这个划分选取是随机的,并不是每次将顺序打乱,很次训练结果不一样有些人可能认为是数据的顺序被打乱了,其实不是的。
好处:
处理简单,只需随机把原始数据分为两组即可
坏处:
但没有达到交叉的思想,由于是随机的将原始数据分组,所以最后验证集分类准确率的高低与原始数据的分组有很大的关系,得到的结果并不具有说服性。