正则化和 高偏差与高分差 之间的关系

在训练模型的过程中,我们经常使用正则化方法来防止过拟合,但是,当正则化参数的大小选择不当,也会引起高偏差和高分差的问题,如下图所示:

从图中可以看出,当正则化参数 λ 取得很大时,会使权重w很小,也就会造成不能取到合适的值,从而使得出现欠拟合的情况。当 λ 取得很小时,会使得权重w可以取得大范围的值甚至任意值,也就会尽可能拟合样本点,从而使得出现过拟合的情况。

于是,我们需要考虑 λ的取值。

我们采取2倍增长的方式,来尝试不同的  λ 值,用训练集得到模型,用验证集得到验证误差,我们选择验证误差最小的 λ 值对应的模型,最后可以用测试集得到推广误差。即步骤如下:

1.使用训练集训练出12个不同程度正则化的模型;

2.用12个模型应用到交叉验证集,计算验证误差;

3.选择得出交叉验证误差最小的模型;

4.用选出的模型应用到测试集中,计算得出推广误差。

我们可以将训练误差和验证误差绘制在一张图标上:

当  λ 较小时,训练集误差较小(过拟合)而交叉验证集误差较大;

随着 λ 的增加,训练误差不断增加(欠拟合),而交叉验证集误差则是先减小后增加。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值