补充（交叉验证法，岭回归，lasso回归）

笑傲江湖2023

已于 2023-07-31 18:19:16 修改

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：人工智能深度学习机器学习

于 2023-07-22 19:13:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48878618/article/details/131871208

版权

机器学习专栏收录该内容

9 篇文章

订阅专栏

目录

1.交叉验证法

总结：岭回归和lasso回归是为了解决线性回归任务中非满秩矩阵不能唯一解的问题。

1.交叉验证法

深刻理解训练集，验证集，测试集概念：

训练集：训练集是机器学习模型用于训练和学习的数据集。通常情况下，训练集是原始数据集的一部分，用于训练模型的参数。模型通过训练集来学习数据的特征，并产生一个模型，以便在之后的预测中使用。

验证集：验证集是用于评估模型性能的数据集。它通常是从原始数据集中划分出来的，用于在训练过程中调整模型的参数和超参数，以提高模型的性能。验证集的作用是帮助开发人员调整模型，避免模型过拟合或欠拟合。

测试集：测试集是用于评估模型最终性能的数据集。它通常是从原始数据集中划分出来的，与训练集和验证集互不重叠。测试集的作用是评估模型在未见过的数据上的性能，并判断模型是否足够准确和鲁棒。

举例：从交叉验证去理解，因为数据量有限时，数据非常珍贵，想要充分利用，举个例子，假设把训练集分成10份，每次从中选取九份做训练集，一份做验证集（另一种意义上的测试集），这种分类可以做十次，最后取验证集结果的平均值（应该这样理解），作为训练结果。

2.岭回归

背景：然任务中(X^TX)往往不是满秩矩阵或者某些列之间的线性相关性比较大，例如存在许多任务中，会出现变量数(属性数)远超过样例数，导致 X 的列数多于行数，（X^TXX）显然不满秩，即 X^TXX）的行列式接近于0，即接近于奇异，此时计算是误差会很大，可解出多个θ(有用的方程组数少于未知数的个数时，没有唯一解，即有无穷多个解)，它们都能使均方误差最小化。即在多元回归中，特征之间会出现多重共线问题，使用最小二乘法估计系数会出现系数不稳定问题，缺乏稳定性和可靠性。
解决：用岭回归

3.lasso回归

定义：LASSO是由1996年Robert Tibshirani首次提出，全称Least absolute shrinkage and selection operator。通过构造一个一阶惩罚函数获得一个精炼的模型;通过最终确定一些指标（变量）的系数为零，解释力很强。(相比较于岭回归。岭回归估计系数等于0的机会微乎其微，造成筛选变量困难)。

详解看参考文献

参考文献

1.岭回归详解从零开始从理论到实践_BlackStar_L的博客-CSDN博客

2.岭回归(Ridge Regression)和Lasso回归_侬本多情。的博客-CSDN博客

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。