深度学习正则化

正则化的目的:解决过拟合的问题。减少泛化误差而不是训练误差,提升模型泛化能力。属于约束惩罚。

L2正则化(权值衰减),使权重更加的接近原点0,使训练参数越来越小。
公式:
               L = E i n + λ ∑ j w j 2 L=E_{in}+\lambda\sum_jw_j^2 L=Ein+λjwj2
相当于在损失的后面加上所有参数的一个平方和。
在这里插入图片描述
在二维平面相当于一个圆,既要保证在圆上又要保证使点更靠近 E i n E_{in} Ein的中心。
L1正则化公式:
            L = E i n + λ ∑ j ∣ w j ∣ L=E_{in}+\lambda\sum_j|w_j| L=Ein+λjwj
相当于加上所有参数的参数和的绝对值。
在这里插入图片描述
在二维平面相当于一个菱形,使 E i n E_{in} Ein相较于点(1,0),达到的解比较稀疏。
正则化和欠约束(不可逆)的关系:
当矩阵不可逆的时候加入正则化就可以变成可逆矩阵,解决收敛问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值