[机器学习笔记] 什么是欠拟合?什么是过拟合?

欠拟合
就是训练程度不够,或训练样本太少,模型在训练数据上的预测效果很差,在新数据上的预测结果也非常糟糕。

过拟合
就是在训练数据上的预测效果非常好,但是在新数据上的预测结果却非常糟糕。

如下图所示,横轴是模型复杂度,纵轴是预测误差。
过拟合

其中,Bias 是预测偏差,variance 是模型复杂度惩罚项,total error 总体误差。
图片来源:http://www.sohu.com/a/202269297_99964548

可以看到,随着模型复杂度的升高,总体误差先降低后升高。
模型复杂度太低,就是欠拟合,此时预测偏差和总体误差都很高。
模型复杂度太高,就是过拟合,此时,预测偏差很小,但是总体误差很高。

我们在训练模型时,如果一味追求训练数据集上的预测效果(预测偏差很小),导致模型复杂度很高,结果在新的数据集上,预测效果很差。

为什么会这样?
通俗地解释就是,我们训练模型是让模型学习数据集中的一般规律,如果训练过度,导致模型把训练集中的特殊规律也学到了,但是新数据集中不存在这些特殊规律,模型在新数据集上的预测性能就会很差。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值