L1和L2正则整理

最新推荐文章于 2023-12-06 21:32:42 发布

努力努力再努力F_

最新推荐文章于 2023-12-06 21:32:42 发布

阅读量621

点赞数

分类专栏：机器学习算法进阶之路

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39751437/article/details/93292833

版权

本文介绍了L1和L2正则化的概念，它们在损失函数中的表现形式及其区别。L1正则化倾向于产生稀疏解，而L2正则化导致权重平滑。从贝叶斯角度看，L1对应拉普拉斯先验，L2对应高斯先验。L1正则化由于其特性，更易得到零参数，而L2则使参数保持在一个小范围内。此外，L1正则化与L0范数的关系以及为何选择L1而非L0的原因也进行了讨论。

摘要由CSDN通过智能技术生成

文章目录

L1和L2正则化的目标是以不同的方式使参数减小，越小的参数说明模型越简单，越简单的模型则越不容易产生过拟合现象，提高模型泛化能力。

一、L1和L2正则分别是什么

L1正则即将权重参数的绝对值之和加入到损失函数中，以二元线性回归为例，损失函数变为：
在这里插入图片描述

L2正则即将权重参数的平方之和加入到损失函数中，以二元线性回归为例，损失函数变为：
在这里插入图片描述

二、L1和L2的区别是什么

1、L1正则化是指在损失函数中加入权值向量w的绝对值之和，即各个元素的绝对值之和，L2正则化指在损失函数中加入权值向量w的平方和。

2、L1的功能是使权重稀疏，正则化项非0参数，优化这个直接等于求稀疏解，而L2的功能是使权重平滑

3、L2的解空间为圆形的（平方画出来是圆形），而L1的解空间为菱形（绝对值画出来为菱形）
4、从贝叶斯角度来看，L1正则化相当于对模型参数w引入了拉普拉斯先验，L2正则化相当于引入了高斯先验
解释：当均值为0时，高斯分布在极值点处是平滑的，

最低0.47元/天解锁文章

努力努力再努力F_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
L1和L2正则整理

L1和L2正则化的目标是以不同的方式使参数减小，越小的参数说明模型越简单，越简单的模型则越不容易产生过拟合现象，提高模型泛化能力。一、L1和L2正则分别是什么L1正则即将权重参数的绝对值之和加入到损失函数中，以二元线性回归为例，损失函数变为：L2正则即将权重参数的平方之和加入到损失函数中，以二元线性回归为例，损失函数变为：二、L1和L2的区别是什么1、L1正则化是指在损失函数中加入权...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。