L1与L2正则化

L1:

L=l(y,f(x))+\frac{\lambda }{n}\sum _w|w|

其中第二项为L1正则化项,对w求偏微分:

\partial _wL=\partial _wl+\frac{\lambda }{n}\sum _wsgn(w)

则第i个w的更新式为:

w_i=w_i-\eta (\partial _{w_i}l+\frac{\lambda }{n}sgn(w_i))

可以看到,L1正则化使得每次更新时,固定加上或减去某一个常数,当w为正时做减法,反之做加法。

这样一来使得值偏小的w,尽可能为0,以达到简化模型的目的。

这里值偏小的w可以认为是‘对应于与输出无关的输入’,即该特征与目标无关联。(与L0正则化相似)

 

L2:

L=l(y,f(x))+\frac{\lambda }{2n}\sum _ww^2

其中第二项为L2正则化项,对w求偏微分:

\partial _wL=\partial _wl+\frac{\lambda }{n}\sum _ww

则第i个w的更新式为:

w_i=w_i-\eta (\partial _{w_i}l+\frac{\lambda }{n}w_i)=(1-\frac{\eta \lambda }{n})w_i-\eta \partial _{w_i}l

可以看到,L2正则化的作用是减去梯度之前先将w固定缩小一个比例,我们可以认为最后使得w尽量的接近于0,以达到简化模型的目的。

参考:

[1] https://baijiahao.baidu.com/s?id=1595711904189222402&wfr=spider&for=pc

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值