L1正则和L2正则

最新推荐文章于 2024-05-18 20:08:10 发布

文达（初学者）

最新推荐文章于 2024-05-18 20:08:10 发布

阅读量797

点赞数 1

分类专栏：机器学习面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38489833/article/details/107855156

版权

L1和L2正则化是机器学习中用于防止过拟合的技术。L1正则化倾向于产生稀疏权重矩阵，使某些特征的系数为0，适合特征选择；而L2正则化则会使所有特征权重接近于0。通过坐标下降法，L1正则化能直接将系数压缩为0，而L2则是压缩至接近于零。引入L1正则化的损失函数在0处导数有突变，更易找到使系数为0的解。

摘要由CSDN通过智能技术生成

L1和L2正则化：
我们所说的正则化，就是在原来的loss function的基础上，加上了一些正则化项或者称为模型复杂度惩罚项。
结构风险最小化：在经验风险最小化的基础上（也就是训练误差最小化），尽可能采用简单的模型，以此提高泛化预测精度。
在这里插入图片描述

那现在我们就看看加了L1正则化和L2正则化之后，目标函数求解的时候，最终解有什么变化。
图像解释（假设X为一个二维样本，那么要求解参数 [公式] 也是二维）：
在这里插入图片描述

1. L1正则化和L2正则化的区别？

L1会趋向于产生少量的特征，而其他的特征都是零，因为最优的参数值很大概率出现在坐标轴上，这样就会导致某一维的权重为零，产生稀疏权重矩阵。

L2会选择更多的特征，这些特征都会接近于零，最优的参数值很小概率出现在坐标轴上，因此每一维的参数都不会是零，当最小化‖w‖时，就会使每一项

最低0.47元/天解锁文章

文达（初学者）

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。