模型评估与选择
"错误率 "(error rate):m 个样本中有α 个样本分类错误,则错误率E= α/m
"精度"(acc旧acy):精度=1一错误率
"误差" (error):学习器的实际预测输出与样本的真实输出之间的差异.
学习器在训练集上的误差称为"训练误差" (training error)或"经验误差" (empirical error)
在新样本上的误差称为"泛化误差" (generalization error)
"过拟合" (overfitting):易选少,最常见的情况是由于学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了
"欠拟合" (underfitting) :易选多