正则化--Lambda

L2正则化通过λ(正则化率)调整权重,使其接近0,呈现正态分布。高λ值增强正则化,可能导致欠拟合;低λ值可能引发过拟合。理想的λ值可使模型有效泛化。λ为0时取消正则化,学习速率和λ的调整需谨慎,以防效果混淆。早停法在训练中的应用也会影响模型复杂度。
摘要由CSDN通过智能技术生成

模型开发者通过以下方式来调整正则化项的整体影响:用正则化项的值乘以名为 lambda(又称为正则化率)的标量。也就是说,模型开发者会执行以下运算:

$$\text{minimize(Loss(Data|Model)} + \lambda \text{ complexity(Model))}$$

执行 L2 正则化对模型具有以下影响:

  • 使权重值接近于 0(但并非正好为 0)
  • 使权重的平均值接近于 0,且呈正态(钟形曲线或高斯曲线)分布。

增加 lambda 值将增强正则化效果。 例如,lambda 值较高的权重直方图可能会如图 2 所示。

image

降低 lambda 的值往往会得出比较平缓的直方图,如图 3 所示。

image

在选择 lambda 值时,目标是在简单化和训练数据拟合之间达到适当的平衡:

    评论
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值