2.1泛化能力
泛化能力强,能够很好的使用于unseen instance,例如,错误率低、精度高
我们希望模型在未见样本上表现好,这一能力通常被称作模型的什么能力?指的是泛化能力
在评价模型性能时,我们更希望它泛化能力强
2.2过拟合和欠拟合
泛化误差:在未来样本上的的误差
经验误差:在训练集上的误差,亦称训练误差
泛化误差越小越好?经验误差是否越小越好?错误。会出现“过拟合”
拿树叶做训练的话
过拟合(误以为树叶必须有锯齿)欠拟合(误以为绿色的都是树叶)
有的情况下,模型学习到了训练数据满足的特有性质,但这些性质不是一般规律,这种现象被称之为过拟合
2.3三大问题
三个关键问题
如何获得测试结果?----评估方法
如何评估性能优劣?----性能度量
如何判断实质差别?----比较检验