scad的oracle性质,变量选择之SCAD算法

本文探讨了SCAD算法在变量选择中的应用,它具有Oracle性质,能产生稀疏解并处理奇异阵。SCAD适用于广义线性模型、非参数模型,其罚函数设计能连续压缩系数并提供无偏估计。模拟结果显示SCAD优于其他主流方法,但在高噪声情况下可能表现不佳。文章还介绍了SCAD的实现方法和R语言代码示例。
摘要由CSDN通过智能技术生成

变量选择之SCAD算法

本文提出了一种用于同时达到选择变量和预测模型系数的目的的方法——SCAD。这种方法的罚函数是对称且非凹的,并且可处理奇异阵以产生稀疏解。此外,本文提出了一种算法用于优化对应的带惩罚项的似然函数。这种方法具有广泛的适用性,可以应用于广义线性模型,强健的回归模型。借助于波和样条,还可用于非参数模型。更进一步地,本文证明该方法具有Oracle性质。模拟的结果显示该方法相比主流的变量选择模型具有优势。并且,模型的预测误差公式显示,该方法实用性较强。

SCAD的理论理解

在总结了现有模型的一些缺点之后,本文提出构造罚函数的一些目标:

罚函数是奇异的(singular)

连续地压缩系数

对较大的系数产生无偏的估计

SCAD模型的Oracle性质,使得它的预测效果跟真实模型别无二致。

并且,这种方法可以应用于高维非参数建模。

SCAD的目标函数如下:

80a67ed3b342f97c14ff0c45213ee225.png

SCAD的罚函数与$\theta$的(近似)关系如下图所示。

115bd7617c1acc42e3f5f35214a0144b.png

可见,罚函数可以用二阶泰勒展开逼近。

c12408c1e6ffc48796beb9bf75e5102a.png

Hard Penality,lasso,SCAD的系数压缩情况VS系数真实值的情况如下图所示。

99cb4882297fc8c0ced85e8c9dce38a7.png

可以看到,lasso压缩系数是始终有偏的,Hard penality是无偏的,但压缩系数不连续。而SCAD既能连续的压缩系数,也能在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值