过拟合以及如何防止过拟合

什么是过拟合过拟合即模型在训练过程中对模型参数进行拟合的过程中,由于训练数据集存在抽样误差(噪声),复杂的模型在训练的过程中会将抽样误差也一同进行拟合。这就导致训练好的模型在训练集上的表现很好,在测试集上的表现很差的原因。导致过拟合的主要原因有两个:数据量太少和模型过于复杂因为机器学习算法在拟合出正确的规则后,具有进一步拟合噪声的能力,因此,模型在训练的过程中极有可能会发生过拟合。过拟合会大...
摘要由CSDN通过智能技术生成

什么是过拟合

过拟合即模型在训练过程中对模型参数进行拟合的过程中,由于训练数据集存在抽样误差(噪声),复杂的模型在训练的过程中会将抽样误差也一同进行拟合。这就导致训练好的模型在训练集上的表现很好,在测试集上的表现很差的原因。
导致过拟合的主要原因有两个:数据量太少和模型过于复杂
因为机器学习算法在拟合出正确的规则后,具有进一步拟合噪声的能力,因此,模型在训练的过程中极有可能会发生过拟合。过拟合会大大降低模型的鲁棒性,因此在实际应用的过程中我们要尽可能的防止模型发生过拟合现象。

如何防止过拟合

关于如何防止过拟合先放一张图
防止过拟合的方法
防止过拟合可以从数据和模型这两个角度进行琢磨。

增加数据量

马云曾经说过(被说过):数据是二十一世纪的石油。不管这个命题是否为真,我们都能意识到数据对当今社会的重要性。的确,增加数据也是解决过拟合问题最为有效的手段。数据量越大,抽样误差就越小,模型拟合的误差就越小,模型的泛化性能就越好。

简化模型

如果我们已经有了足够多的训练数据,但是我们训练的模型还是会发生过拟合的话,那就有可能是我们的模型过于复杂了,导致模型对一些数据中的一些噪声都进行了和好的拟合。模型只是对部分数据产生过拟合,我们可以在保证模型能够正确的拟合出数据中的规则的同时,又能适当的降低模型的复杂度,减少模型对抽样误差的拟合程度。适当的降低模型的复杂度

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值