Lasso introduction

最新推荐文章于 2024-06-07 23:48:24 发布

空城--

最新推荐文章于 2024-06-07 23:48:24 发布

阅读量1k

点赞数 1

分类专栏：翻译学习

Lasso 是一种回归分析方法，结合变量选择和正则化，用于提高模型预测精度和可解释性。它通过限制回归系数的绝对值之和来实现模型的稀疏性，有助于防止过拟合。Lasso 与岭回归不同，它可以将一些系数设为零，类似于软阈值操作。优化问题通常使用拉格朗日形式表示，并且在正交协变量下，Lasso 解决方案具有稀疏性特性。

摘要由CSDN通过智能技术生成

在统计和机器学习中，LASSO是一种既进行变量选择又进行正则化的回归分析方法，以提高所产生统计模型的预测精度和可解释性。Lasso最初是为最小二乘模型设计的，这个简单的例子揭示了估计器的大量行为，包括它与岭回归（ridge regression）和最佳子集选择的关系，以及Lasso系数估计和所谓的软阈值之间的关系。Lasso执行子集选择的能力依赖于约束的形式，并有多种解释，包括几何、贝叶斯统计和凸分析。

Lasso和基追踪去噪相关度较高（BPDN）。Lasso能够通过强制回归系数绝对值之和小于一个固定值来实现这两个目标（一、提高预测准确度；二、防止模型过拟合），比如会将一些系数设置为零。假设 $y_{i}$ 是输出， $x_{i}=(x_{1},x_{2},...,x_{p})^{T}$ 定义为输入向量,希望通过Lasso解决以下问题：

$\min _{\beta_{0}, \beta}\left\{\frac{1}{N} \sum_{i=1}^{N}\left(y_{i}-\beta_{0}-x_{i}^{T} \beta\right)^{2}\right\} \text { subject to } \sum_{j=1}^{p}\left|\beta_{j}\right| \leq t$

在这里t是预先指定的自由参数，让它决定正则化的数量。X作为系数矩阵， $X_{i j}=\left(x_{i}\right)_{j}$ ， $x_{i}^{T}$ 表示X的第i行。

所以表达可以更紧凑地表示为：

最低0.47元/天解锁文章

空城--

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
Lasso introduction

在统计和机器学习中，LASSO是一种既进行变量选择又进行正则化的回归分析方法，以提高所产生统计模型的预测精度和可解释性。Lasso最初是为最小二乘模型设计的，这个简单的例子揭示了估计器的大量行为，包括它与岭回归（ridge regression）和最佳子集选择的关系，以及Lasso系数估计和所谓的软阈值之间的关系。Lasso执行子集选择的能力依赖于约束的形式，并有多种解释，包括几何、...
复制链接

扫一扫