Lasso introduction

Lasso 是一种回归分析方法,结合变量选择和正则化,用于提高模型预测精度和可解释性。它通过限制回归系数的绝对值之和来实现模型的稀疏性,有助于防止过拟合。Lasso 与岭回归不同,它可以将一些系数设为零,类似于软阈值操作。优化问题通常使用拉格朗日形式表示,并且在正交协变量下,Lasso 解决方案具有稀疏性特性。
摘要由CSDN通过智能技术生成

       在统计和机器学习中,LASSO是一种既进行变量选择又进行正则化的回归分析方法,以提高所产生统计模型的预测精度和可解释性。Lasso最初是为最小二乘模型设计的,这个简单的例子揭示了估计器的大量行为,包括它与岭回归(ridge regression)和最佳子集选择的关系,以及Lasso系数估计和所谓的软阈值之间的关系。Lasso执行子集选择的能力依赖于约束的形式,并有多种解释,包括几何、贝叶斯统计和凸分析。

        Lasso和基追踪去噪相关度较高(BPDN)。Lasso能够通过强制回归系数绝对值之和小于一个固定值来实现这两个目标(一、提高预测准确度;二、防止模型过拟合),比如会将一些系数设置为零。假设y_{i}是输出,x_{i}=(x_{1},x_{2},...,x_{p})^{T}定义为输入向量,希望通过Lasso解决以下问题:

                                              \min _{\beta_{0}, \beta}\left\{\frac{1}{N} \sum_{i=1}^{N}\left(y_{i}-\beta_{0}-x_{i}^{T} \beta\right)^{2}\right\} \text { subject to } \sum_{j=1}^{p}\left|\beta_{j}\right| \leq t

在这里t是预先指定的自由参数,让它决定正则化的数量。X作为系数矩阵,X_{i j}=\left(x_{i}\right)_{j}x_{i}^{T}表示X的第i行。

所以表达可以更紧凑地表示为:

                                              

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值