L1正则化和L2正则化的区别？

最新推荐文章于 2024-05-12 10:46:29 发布

不拿大场offer不改名

最新推荐文章于 2024-05-12 10:46:29 发布

阅读量660

点赞数

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37089829/article/details/108789188

版权

算法专栏收录该内容

20 篇文章 2 订阅

订阅专栏

L1正则化目的：减少参数的绝对值总和。

$\left \| x \right \|_{1} = \sum_{i}\left | x_{i} \right |$

L2正则化目的：减少参数平方的总和。

$\left \| x \right \|_{1} = \sum_{i}x_{i}^{2}$

由L1正则化的定义可以看出最优的参数值很大概率出现在坐标轴上，这样就会导致某一维的权重为0，产生稀疏权重矩阵；

而L2正则化的最优参数值很小概率出现在坐标轴上，因此每一维的参数都不会是0；

另外一个区别就是：

L1正则化可通过假设权重w的先验分布为拉普拉斯分布，由最大后验概率估计导出。

L2正则化可通过假设权重w的先验分布为高斯分布，由最大后验概率估计导出。

不拿大场offer不改名

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
L1正则化和L2正则化的区别？

L1正则化目的：减少参数的绝对值总和。L2正则化目的：减少参数平方的总和。由L1正则化的定义可以看出最优的参数值很大概率出现在坐标轴上，这样就会导致某一维的权重为0，产生稀疏权重矩阵；而L2正则化的最优参数值很小概率出现在坐标轴上，因此每一维的参数都不会是0；另外一个区别就是： L1正则化可通过假设权重w的先验分布为拉普拉斯分布，由最大后验概率估计导出。 L2正则化可通过假设权重w的先验分布为高斯分布，由最大后验概率估计导出。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。