线性回归、岭回归（Ridge Regression）和Lasso回归关系

芋泥仔

已于 2025-03-31 16:05:05 修改

阅读量814

点赞数 16

文章标签：回归线性回归算法

于 2025-03-31 15:52:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Bobo__wang/article/details/146841155

版权

线性回归、岭回归（Ridge Regression）和Lasso回归关系

线性回归、岭回归（Ridge Regression）和Lasso回归是三种常用的回归方法，本质都是线性回归方法，它们的核心区别在于对模型复杂度的控制方式以及对特征的处理。以下是它们的详细对比：

1. 线性回归（Linear Regression）

核心思想：通过最小化预测值与真实值之间的均方误差（MSE）来拟合数据。
损失函数：
$J(\beta) = \sum_{i=1}^n (y_i - \beta_0 - \sum_{j=1}^p \beta_j x_{ij})^2$
特点：
- 无正则化项，直接最小化误差。
- 当特征高度相关或特征数大于样本数时，模型容易过拟合。
- 无法处理多重共线性问题（特征之间高度相关）。

2. Lasso回归（Lasso Regression）

核心思想：在线性回归的损失函数中加入 L1正则化项，通过稀疏化系数实现特征选择。
损失函数：
$J(\beta) = \sum_{i=1}^n (y_i - \beta_0 - \sum_{j=1}^p \beta_j x_{ij})^2 + \lambda \sum_{j=1}^p |\beta_j|$
特点：
- L1正则化（系数的绝对值之和）会将部分系数压缩到零，从而实现特征选择。
- 适用于高维数据（特征数远大于样本数）的场景，可自动筛选重要特征。
- 当特征高度相关时，Lasso可能随机选择一个特征，而岭回归会平分权重。

3. 岭回归（Ridge Regression）

核心思想：在线性回归的损失函数中加入 L2正则化项，通过对系数进行约束防止过拟合。
损失函数：
$J(\beta) = \sum_{i=1}^n (y_i - \beta_0 - \sum_{j=1}^p \beta_j x_{ij})^2 + \lambda \sum_{j=1}^p \beta_j^2$
特点：
- L2正则化（系数的平方和）会压缩系数大小，但不会将系数完全压缩到零。
- 适用于处理多重共线性问题，提高模型的稳定性。
- 超参数 (\lambda) 控制正则化强度：(\lambda) 越大，系数压缩越明显。

核心区别总结

特性	线性回归	Lasso回归（L1）	岭回归（L2）
正则化项	无	L1正则化（系数绝对值之和）	L2正则化（系数平方和）
系数处理	可能过大或过拟合	压缩部分系数到零（稀疏化）	压缩系数但不为零
特征选择能力	无	有	无
适用场景	低维、无共线性	高维、需要特征选择	高维、存在共线性
超参数调优	无	$\lambda$ （控制稀疏性）	$\lambda$ （控制压缩强度）
几何解释	无约束优化	菱形约束（系数在菱形顶点）	圆形约束（系数在圆内）

补充说明

弹性网络（Elastic Net）：结合了L1和L2正则化，适用于同时需要特征选择和解决共线性的场景。
选择建议：
- 如果特征数量多且需要筛选，用Lasso。
- 如果特征之间有强相关性，用岭回归。
- 如果特征数远大于样本数，优先Lasso或弹性网络。

理解三者的区别有助于根据实际问题选择合适的模型，平衡模型的偏差与方差，提升泛化能力。

博客等级

码龄5年

8
原创

136
点赞

101
收藏

44
粉丝

关注

私信

热门文章

分类专栏

机器学习 1篇
笔记 1篇

展开全部收起

最新评论

MPC（Model Predictive Control）原理与实践问题
芋泥仔: 发帖的启发在于：最近发现之前做过很多算法，但是都没有做过总结，很多东西在脑子里只有大概得印象，对于算法之间的优缺点模糊，在实践中对算法的选择缺少主观能动性，一般都是根据已确定的方向去走。希望能将算法以容易理解的方式记录下来，如果内容有需要补充的地方或者其他建议，欢迎大家跟我交流~
【关于torch.save和pickle.dump保存网络结构的方法】
CSDN-Ada助手: 恭喜你开始博客的创作！标题看起来非常有趣，我对torch.save和pickle.dump保存网络结构的方法也非常感兴趣。希望你能在博客中详细介绍这两种方法的使用和比较，以及它们在实际应用中的优缺点。同时，如果可能的话，你可以尝试探索其他保存网络结构的方法，例如ONNX或TensorFlow的SavedModel。期待你在下一篇博客中继续分享和探索更多有关深度学习模型保存的内容。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。