周志华《机器学习》第二章 模型评估与选择——经验误差与过拟合

周志华《机器学习》(西瓜书)目录

https://editor.csdn.net/md?articleId=106864771
————————————————————————

模型评估与选择

  • 经验误差与过拟合
  • 评估方法
  • 性能度量
  • 比较检验
  • 偏差与方差

经验误差与过拟合

我们把学习器的实际预测输出与样本的真实输出之间的差异称为"误差"(error)。学习器在训练集上的误差称为"训练误差" (training error)或"经验误差" (empirical error) ,在新样本上的误差称为"泛化误差" (generalization error)。

当学习器把训练样本学得"太好"了的时候,很可能巳经把训练样本自身的一些特点当作了所有潜在样本都 会具有的一般性质,这样就会导致泛化性能下降这种现象在机器学习中称为 “过拟合” (overfitting). 与"过拟合"相对的是"欠拟合" (underfitting),这是指对训练样本的一般性质尚未学好。

拟合情况

内容扩展

一、经验误差(训练误差)与泛化误差

经验误差(训练误差):模型在训练集上的误差称为“经验误差”(empirical error)或者“训练误差”“training error”。
泛化误差:模型在新样本集(测试集)上的误差称为“泛化误差”(generalization error)。

二、偏差与方差

偏差:描述了模型的期望预测(模型的预测结果的期望)与真实结果的偏离程度。偏离程度越大,说明模型的拟合能力越差,此时造成欠拟合。
方差:描述了数据的扰动造成的模型性能的变化,即模型在不同数据集上的稳定程度。 方差越大,说明模型的稳定程度越差。如果模型在训练集上拟合效果比较优秀,但是在测试集上拟合效果比较差劣,则方差较大,说明模型的稳定程度较差,出现这种现象可能是由于模型对训练集过拟合造成的。

三、欠拟合与过拟合

过拟合:指过于紧密或精确地匹配特定资料集,以致于无法良好地拟合其他资料或预测未来的观察结果的现象。
欠拟合:相较于数据而言,模型参数过少或者模型结构过于简单,以至于无法捕捉到数据中的规律的现象。

参考文献

[1] https://github.com/datawhalechina/pumpkin-book
[2] https://zhuanlan.zhihu.com/p/33199938
[3] https://blog.csdn.net/zhihua_oba/article/details/78684257

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jack_jay_du

你的鼓励是我的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值