L1和L2正则化

最新推荐文章于 2024-05-18 20:08:10 发布

qq_43152949

最新推荐文章于 2024-05-18 20:08:10 发布

阅读量305

点赞数

分类专栏：机器学习算法

原文链接：https://blog.csdn.net/red_stone1/article/details/80755144

版权

机器学习算法专栏收录该内容

6 篇文章 2 订阅

订阅专栏

L0

L0范数指的是向量中非零元素的个数，L0正则化就是限制非零元素的个数在一定的范围，这很明显会带来稀疏。一般而言，用L0范数实现稀疏是一个NP-hard问题，因此人们一般使用L1正则化来对模型进行稀疏约束。

L1和L2

L2
在这里插入图片描述

L1

|w| < C

稀疏性

参考：https://blog.csdn.net/red_stone1/article/details/80755144

另外一种解释：
假设费用函数L与某个参数w的关系如图所示：
在这里插入图片描述
则最优的 w在绿点处，w非零。
现在施加 L2 regularization，新的费用函数（L+λw²）如图中蓝线所示：

最优的 x 在黄点处，x 的绝对值减小了，但依然非零。
而如果施加 L1 regularization，则新的费用函数（L+λ|w|）如图中粉线所示：
在这里插入图片描述
最优的w就变成了 0。这里利用的就是绝对值函数的尖峰。两种regularization能不能把最优的w变成0，取决于原先的费用函数在 0 点处的导数。如果本来导数不为 0，那么施加 L2 regularization 后导数依然不为 0，最优的 x 也不会变成 0。而施加 L1 regularization 时，只要 regularization 项的系数 C 大于原先费用函数在 0 点处的导数的绝对值，x = 0 就会变成一个极小值点。上面只分析了一个参数 x。事实上 L1 regularization 会使得许多参数的最优值变成 0，这样模型就稀疏了。

参考：https://www.zhihu.com/question/37096933/answer/70426653

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
L1和L2正则化

L1和L2L1L2|w| < C稀疏性参考：https://blog.csdn.net/red_stone1/article/details/80755144另外一种解释：假设费用函数L与某个参数w的关系如图所示：则最优的 w在绿点处，w非零。现在施加 L2 regularization，新的费用函数（L+λw²）如图中蓝线所示：最优的 x 在黄点处，x ...
复制链接

扫一扫

专栏目录

qq_43152949 CSDN认证博客专家 CSDN认证企业博客

码龄6年

38: 原创

45万+: 周排名

161万+: 总排名

2万+: 访问

: 等级

543: 积分

3: 粉丝

3: 获赞

2: 评论

53: 收藏

私信

关注

热门文章

分类专栏

论文 26篇
算法 1篇
深度学习 7篇
python 1篇
pytoch实现 4篇
机器学习算法 6篇

最新评论

激活函数
ctotalk: 学习了。
EfficientDet
gjx521125: 请问为什么BiFPN比FPN参数还低，FPN不是只有一条自上而下通路吗，为什么这篇文章中画了两条？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。