关于过拟合的更多思考

过拟合在表现上是:低偏差 高方差 在训练集上的偏差低  在测试集上的偏差比较高

引起过拟合的原因:

1.从模型的复杂度来说:

①模型过于复杂

②数据比较少,导致模型学习的过程中,只学习到了很少的数据构成的模型,导致模型学简单了,不能在测试集上有很好的表现

2.从数据的的角度来说

①数据中的噪声比较多,使得模型学到的很复杂(模型本身就来拟合数据,但是有噪声,使得数据的规律性大大降低,只能用更复杂的模型来学习,来达到训练集中较低的偏差),从而导致过拟合

②训练集和测试集的数据分布不同,这样就很容易导致过拟合(模型学习的是训练集的分布,然后用来预测不同分布的测试集,肯定不准)

 

那么如何分析出过拟合是因为   数据不足   还是  模型复杂度不够呢?

控制变量法!!!!(我猜的)

关于样本数量,可以绘制学习曲线,可以逐步增加数据,如果最终的学习曲线并没有收敛,说明数据的量是有问题的

当模型复杂度比较大,从而造成过拟合

 

欠拟合的学习曲线

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值