L1正则化方法（lasso）和L2（ridge）正则化方法的区别

最新推荐文章于 2024-07-11 09:21:08 发布

wangyanao520

最新推荐文章于 2024-07-11 09:21:08 发布

阅读量5k

点赞数 4

分类专栏：数据分析文章标签：机器学习 L1和L2正则化区别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a13526863959/article/details/84314031

版权

数据分析专栏收录该内容

5 篇文章 0 订阅

订阅专栏

L1正则化和L2正则化可以看做是损失函数的惩罚项，惩罚就是损失函数中的某些参数做了一些限制
对于线性回归模型，使用 L1 正则化的模型叫做 Lasson 回归，使用 L2 正则化的模型叫做 Ridge 回归（岭回归）。
L1和L2正则化的线性回归：

minw12nsamples||Xw−y||22+α||w||1 （式中加号后面一项α||w||1即为L1正则化项）
minw12nsamples||Xw−y||22+α||w||22

L1正则化和L2正则化的说明如下：

L1正则化是指权值向量w中各个元素的绝对值之和，通常表示为||w||1
L2正则化是指权值向量w中各个元素的平方和然后再求平方根（可以看到Ridge回归的L2正则化项有平方符号），通常表示为||w||2

L1正则化和L2正则化的作用：

L1正则化可以产生稀疏权值矩阵，即产生一个稀疏模型，可以用于特征选择
L2正则化可以防止模型过拟合（overfitting）；一定程度上，L1也可以防止过拟合

L1（拉格朗日）正则假设参数的先验分布是Laplace分布，可以保证模型的稀疏性，也就是某些参数等于0
L2（岭回归）正则假设参数的先验分布是Gaussian分布，可以保证模型的稳定性，也就是参数的值不会太大或太小。
在实际使用中，如果特征是高维稀疏的，则使用L1正则；如果特征是低维稠密的，则使用L2正则。

在这里插入图片描述

关注

4
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。