目录
前言
Lasso 回归也叫套索回归,是通过生成一个惩罚函数是回归模型中的变量系数进行压缩,达到防止过度拟合,解决严重共线性的问题,Lasso 回归最先由英国人Robert Tibshirani提出,目前在预测模型中应用非常广泛。
一般线性回归模型的目标是最小化残差平方和,即通过拟合一个线性方程来预测目标变量。然而,在实际问题中,可能存在大量的自变量,其中一些可能对目标变量的预测能力较弱或冗余。此时,Lasso回归通过引入L1正则化 (即Lasso惩罚项),可以将系数向量中小的权重变为0,从而实现特征选择和模型稀疏性。Lasso回归具备如下几个作用。
特征选择:Lasso回归可以用于选择最重要的特征。它通过在优化目标函数中添加一项惩罚项(L1正则化)来实现稀疏性,使得系数向量中很多特征的权重变为0。通过选择非零系数对应的特征,可以筛选出对目标变量有最大预测能力的特征,从而简化模型,提高模型的泛化能力。
多重共线性问题:在医学研究中,往往存在多个相关的自变量。Lasso回归可以通过自变量之间的相关关系,将相关的自变量的系数变为0,从而降低多重共线性对回归结果的影响。
预测建模:通过Lasso回归可以建立模型来预测患者的疾病风险或病情发展。在医学研究中ÿ