L1和L2的区别

最新推荐文章于 2023-03-03 12:14:15 发布

buptwangzhiwen

最新推荐文章于 2023-03-03 12:14:15 发布

阅读量6k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014073295/article/details/82728299

版权

区别：

1.L1是模型各个参数的绝对值之和。

L2是模型各个参数的平方和。

2.L1会趋向于产生少量的特征，而其他的特征都是0

因为最优的参数值很大概率出现在坐标轴上，这样就会导致某一维的权重为0 ，产生稀疏权重矩阵

L2会选择更多的特征，这些特征都会接近于0。

最优的参数值很小概率出现在坐标轴上，因此每一维的参数都不会是0。当最小化||w||时，就会使每一项趋近于0

　L1范数：

　　L1范数符合拉普拉斯分布，是不完全可微的。表现在图像上会有很多角出现。这些角和目标函数的接触机会远大于其他部分。就会造成最优值出现在坐标轴上，因此就会导致某一维的权重为0 ，产生稀疏权重矩阵，进而防止过拟合。

　L2范数：

　　L2范数符合高斯分布，是完全可微的。和L1相比，图像上的棱角被圆滑了很多。一般最优值不会在坐标轴上出现。在最小化正则项时，可以是参数不断趋向于0.最后得到很小的参数。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
L1和L2的区别

区别：1.L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和。2.L1会趋向于产生少量的特征，而其他的特征都是0因为最优的参数值很大概率出现在坐标轴上，这样就会导致某一维的权重为0 ，产生稀疏权重矩阵L2会选择更多的特征，这些特征都会接近于0。最优的参数值很小概率出现在坐标轴上，因此每一维的参数都不会是0。当最小化||w||时，就会使每一项趋近于0 ...
复制链接

扫一扫

buptwangzhiwen CSDN认证博客专家 CSDN认证企业博客

码龄10年

19: 原创

36万+: 周排名

144万+: 总排名

2万+: 访问

: 等级

442: 积分

2: 粉丝

9: 获赞

0: 评论

56: 收藏

私信

关注

分类专栏

路径优化 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。