经验误差和过拟合
错误率(error rate):分类错误的样本数占总样本的比例
“精度”(accuracy):就是1-错误率。。。(为嘛不翻译成正确率)
误差(error ):实际预测输出和样本真实输出之间的差异
训练误差/经验误差(training error):学习器在训练集上的误差
泛化误差(generalization error):在新样本上的误差(就是实际测试的)
过拟合(overfitting):在训练时把训练误差弄到了最小,某种程度上在真实规律的基础上把训练样本一些自身的“特点”也融入了进来,会导致泛化能力降低(也就是说训练样本结果很好,测试结果不一定好)。
欠拟合(underfitting):和过拟合相反,对训练样本的一般性质没学好