近期学习了Lasso,并使用matlab运行程序,使用该命令时详细研究了它的使用方法,现在根据matlab关于Lasso的帮助文档对Lasso进行介绍,不过我并未全部了解该命令的参数意义,所以只介绍部分的使用方法:
输入参数:
Alpha: 即α的值,当为 0,表示Lasso为岭回归,这时它当然不是Lasso了,而是和Lasso相似的岭回归模型,当该值为 1(默认值),则此程序为 Lasso,若为0~1之间,表示是 elastic net算法,也是与 岭回归和Lasso相似而不同的算法。
CV:为 交叉验证的设置。用于估计最佳的λ的值。 默认为“resubstitution”,这个我没有研究,而是使用了较为广泛的 K折交叉验证,一般 赋值 k =5或10,就是 5折交叉验证或10折交叉验证。
DFmax:返回拟合式中 非零系数的数量。
Lambda:这个就是Lasso或者岭回归或者elastic net中的参数λ的值,如果使用交叉验证,会使用交叉验证选择一个最优λ,如果默,则由系统根据计算公式默认赋值一个λ的最大值,关于最大值计算公式,在Lasso程序中有说明,或者你也可以指定λ的值。在确定该最大值后,还需要和Lambdaratio 和 Numlambda 确定λ的取值。
Lambdaratio λ的取值比例,它和Lambda构成λ的取值范围区间。
Numlambda λ的取值数量。Lambda确定λ的最大值,比如a,Lambdaratio确定λ最小值与最大值的比率,如Lambdaratio为0.01,那么λ的取值区间即为 0.01*a~a,而Numlambda则确定改区间取多少个λ,从而最终确定了λ的取值。
Reltol 坐标下降法的阈值。坐标下降法是求解elastic net的常用方法,这是该方法的一个参数。
Standardize:布尔值。是否对Lasso进行缩放。一般设置为 true,即 进行缩放。
输出参数:
Intercept:true or false ,截距,就是线性方程中的常数项。若给定true,则表示存在 截距。
lambda:列出使用的λ的值,升序排列,而且后面的参数的顺序与这个λ对应
alpha:α值
MSE:均方误差
DF
Fitinfo中的字段:
在使用CV交叉验证后,可以输出本字段中的结果,内容和上面的差不多,先不描述了,大家想了解的话我再加。