权重衰减和L1 L2正则化的关系?

权重衰减(Weight Decay)是一种正则化技术,它包括了L1正则化和L2正则化两种情况。

  1. L1 正则化

    在L1正则化中,惩罚项是权重的绝对值之和。它的数学形式是在损失函数中加入了权重的L1范数:

    [L’(\theta) = L(\theta) + \lambda \sum_{i} |w_i|]

    其中:

    • (L’(\theta)) 是带有L1正则化的新损失函数。
    • (L(\theta)) 是原始的损失函数。
    • (\lambda) 是L1正则化的超参数,控制了L1惩罚项的强度。
    • (w_i) 是网络中的权重。

    L1正则化倾向于将一些权重稀疏化,即使得一部分权重趋向于零,从而使模型变得更加稀疏和简单,有助于特征选择。

  2. L2 正则化

    在L2正则化中,惩罚项是权重的平方和的平方根。它的数学形式是在损失函数中加入了权重的L2范数:

    [L’(\theta) = L(\theta) + \lambda \sqrt{\sum_{i} w_i^2}]

    其中:

    • (L’(\theta)) 是带有L2正则化的新损失函数。
    • (L(\theta)) 是原始的损失函数。
    • (\lambda) 是L2正则化的超参数,控制了L2惩罚项的强度。
    • (w_i) 是网络中的权重。

    L2正则化倾向于使权重变得更加均匀,避免过度依赖少数几个特征。

总的来说,权重衰减包括了L1和L2正则化两种情况,它们都是通过在损失函数中添加一个惩罚项来减小模型的复杂度,防止过拟合。 L1正则化倾向于稀疏化权重,而L2正则化倾向于使权重更加均匀。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王摇摆

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值