防止过拟合方法之添加正则项的思想原理及作用

本文探讨了两种风险最小化——经验风险与结构风险,并阐述了正则化的思想,以防止过拟合。通过引入正则项,平衡模型复杂度与泛化能力,从而在有限训练数据的情况下提升模型的泛化性能。同时,利用偏差方差分解,解释了正则化如何影响模型的偏差和方差,帮助理解模型的拟合与泛化能力之间的权衡。
摘要由CSDN通过智能技术生成

防止过拟合方法之添加正则项的思想原理及作用

一、两种风险最小化

李航老师的统计学习方法中提到了两种风险最小化,一种是经验风险最小化,另一种是结构风险最小化,
首先我们知道模型的损失越小那么就表明模型越好,模型的输入X以及输出Y均为随机变量,遵循联合分布,所以理论上模型关于联合分布P(X,Y)的平均损失(称为期望损失)如下:
在这里插入图片描述
给定训练集,模型关于训练集的平均损失称为经验风险,如下:
在这里插入图片描述
根据大数定律,当样本容量趋于无穷大时,便有经验风险趋于期望损失,所以这便是可以用经验风险估计期望风险的原因。于是便有了经验风险最小化原则
在这里插入图片描述
但是现实情况是,我们无法获取无限的训练集,而且训练集往往是真实数据集的一个很小的子集, 并不能很好的反映全部数据的真实分布,所以经验风险最小化很容易出现虽然在训练集上错误率低,但在测试集上错误率高的情况,这种情况就是过拟合。过拟合是由于训练数据

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值