欠拟合、过拟合及解决方法

一、欠拟合

    首先欠拟合就是模型没有很好的捕捉到数据特征,不能够很好的拟合数据,如下面的例子:

        左图表示size和prize关系的数据,中间的图就是出现欠拟合的的模型,不能够很好的拟合数据,如果在中间的多项式上再加一个二项式,就可以很好的拟合数据了,如右图所示。

        解决方法:

1、添加其它的特征项,有时候模型欠拟合是数据的特征项不够造成的,可以添加其它的特征项来很好的解决,例如"组合","范化",”相关性“三类特征是特征添加的重要手段,无论在什么场合,都可以照葫芦画瓢,总会得到满意的效果。除上面的特征外,“上下文特征”、“平台特征”等等,都 可以作为特征添加的首选项。

2、添加多项式特征,这个在机器学习算法里用的很普遍,例如上面的例子,将线性模型加入二次项或者三次项使模型范化能力更强

3、减少正则化参数,正则化的目的是用来防止过拟合的,但是现在模型出现了欠拟合,则需要减少正则化参数

 

二、过拟合

       通俗一点来说是模型把数据学习的太彻底,以至于把数据中的噪声特征也学到了,这样就会导致后期测试的时候不能很好的识别数据,即不能正确的分类数据,模型泛化能力太差,例如下面的例子:

上图左边表示size和prize的关系,我们学习到的模型曲线如右图所示,虽然在训练的时候很好的匹配数据,但是很显然扭曲了曲线,不是真实的size和prize曲线。

解决方法:

      1、重新清洗数据,导致过拟合的一个原因也有可能是数据不纯导致的,如果出现了过拟合就需要我们重新清洗数据。

      2、增大数据的训练量,还有一个原因就是我们用于训练的数据量太小导致的,训练数据占总数据的比例过小

      3、采用正则化方法。正则化方法包括L0正则,L1正则和L2正则,而正则一般是在目标函数之后加上对于的范数,但是在机器学习中一般用L2正则

      4、采用dropout方法。这个方法在神经网络中很常用。dropout方法是imageNet中提出的一种方法,通俗一点讲就是dropout方法在训练时让神经元以一定概率的不工作,具体看下图:

   

如上图所示,左图(a)是没有使用dropout方法的标准神经网络,右边(b)图是在训练时使用了dropout方法的神经网络,即在训练的时候以一定的概率p来跳过一定的神经元

 

转载于:https://www.cnblogs.com/baoxuhong/p/9818930.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
过拟合欠拟合是机器学习中常见的问题,这些问题通常与模型的复杂性、数据的质量、训练数据的数量和训练过程的参数设置有关。以下是可能导致过拟合欠拟合的原因和相应的解决方法过拟合产生的原因: 1. 训练数据量太少:在训练数据非常少的情况下,模型会过于关注训练数据中的噪声和异常值,从而导致过拟合。 2. 模型复杂度过高:如果模型太过复杂(例如,有太多的参数),那么它可以学习到训练数据中的细节和噪声,这样就会导致过拟合。 3. 训练时间过长:训练时间过长也可能导致过拟合,因为模型可能会在训练数据上进行过多的迭代。 过拟合解决方法: 1. 增加训练数据量:通过增加更多的训练数据,可以帮助模型更好地学习数据的真实特征,从而减少过拟合的风险。 2. 简化模型:通过减少模型中的参数数量或者层数,可以降低模型的复杂度,从而减少过拟合的风险。 3. 正则化:在模型训练过程中,加入正则化项(如L1或L2正则化)可以限制模型的复杂度,从而减少过拟合的风险。 欠拟合产生的原因: 1. 模型复杂度过低:如果模型太过简单,它可能无法捕捉数据的复杂特征,从而导致欠拟合。 2. 数据质量差:如果数据质量差,例如存在噪声或缺失值,那么模型可能无法学习到正确的模式,从而导致欠拟合欠拟合解决方法: 1. 增加模型复杂度:通过增加模型的参数数量或者层数,可以使模型更加复杂,从而更好地捕捉数据的复杂特征。 2. 改善数据质量:通过数据清洗、特征选择等方法,可以改善数据质量,从而帮助模型更好地学习数据的模式。 3. 调整超参数:通过调整模型的超参数(如学习率、正则化参数等),可以优化模型,从而更好地适应数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值