机器学习中的欠拟合与过拟合

欠拟合与过拟合

经过对数据样本的训练,拟合出一条直线。
  • 欠拟合:图1中直线并不能很好地穿过数据样本点

  • 过拟合:图3中这条线虽然很好地穿过了数据点,但是不能够对未来的数据有很好的预测,泛化能力差。
    在这里插入图片描述
    在这里插入图片描述
    为了解决过拟合问题,提出正则化的概念:

  • L2范数正则化解决过拟合(Ridge Regression,岭回归):
    在这里插入图片描述

  • L1范数正则化解决过拟合(LASSO回归):
    在这里插入图片描述

  • L1与L2结合解决过拟合(Elastic Net,弹性网):
    在这里插入图片描述

综合运用L1和L2正则化,按一定的占比分配。

  • 岭回归求解:
    目标函数:
    在这里插入图片描述
    求解:
    在这里插入图片描述
    迭代公式:在这里插入图片描述
    在迭代过程中 θ \theta θj的值会不断减小。
    为啥使用岭回归后过拟合的风险会减小呢?我们举个例子:
    假设为:在这里插入图片描述

    其中 θ \theta θ 2=0.0001的数值比较小,对目标函数的影响较小,那么只剩两个特征(x1和x3)起作用,模型相对来说就比较简单。模型越简单,过拟合的风险就越小。通过训练数据来决定 θ \theta θ的值。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值