宽带离网用户分析之Lasso和Group Lasso
Lasso
Lasso,全称为(The Least Absolute Shrinkage and Selectionator operator),是Tibshirani[1]在1996年提出的稀疏特征选择方法。
minβ||Y−Xβ||22+λ||β||1 (1)
其中 X∈Rm×n , Y∈Rm 分别表示数据矩阵和类标向量, λ≥0 是正则参数, β∈Rn 是特征选择参数向量。第一项为损失函数项,第二项为罚函数项。
公式的含义很简单,就是找到所有特征的权重向量 β ,使得我们的(1)式的值最小,不但看出 ||Y−Xβ||2