随机最速下降法 (SGD) 添加L2 范数

对于标准的SGD的loss function -> L(w) (learning rate/step size 为a)

w_{t+1} = w_{t}-a\times \triangledown_{w} L(w_{t})

 

在添加了L2 范数之后 新的 Loss function 为

L(w) = L_{0}(w) + \lambda||w||_{2}^{2}

 

新的梯度为

\triangledown _{w}L(w) = \triangledown_w[L_{0}(w)+\lambda||w||_{2}^{2}]=\triangledown_{w} L_{0}(w)+2\lambda w

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值