有1000组<特征, 类别>数据,训练一个分类器
1. 分类器无需进行模型选择
1000组数据可以直接划分为 training set + test set
2. 分类器涉及模型选择
比如k近邻分类器对k值的选择,
SVM分类器对参数个数的选择,
DNN分类器对迭代模型的选择,
1000组数据得划分成三份:training, validation and test sets
(1)训练集 + 验证集:800组
用于进行模型选择,并训练模型参数
K折交叉验证
(2)测试集:200组
测试训练好的选定模型的分类效果
参考
[1] http://research.cs.tamu.edu/prism/lectures/iss/iss_l13.pdf