2013 AAAI: Uncorrelated Lasso

weixin_30347009

于 2015-01-26 11:13:00 发布

阅读量141

点赞数

原文链接：http://www.cnblogs.com/shalijiang/p/4249773.html

版权

Si-Bao Chen, Chris Ding, Bin Luo and Ying Xie. Uncorrelated Lasso. AAAI, 2013.

第一作者是安徽大学陈思宝副教授。

第二作者 Chris Ding 是德克萨斯大学阿灵顿分校的教授，Google Scholar 上他引超过 15700 次。

这篇文章考虑 Lasso 做特征选择时特征之间的相关性，使选出来的特征尽量不相关以减少冗余。

优化形式是在原 Lasso 后加入一相关系数矩阵（平方）的凸项，如下图：

其中矩阵 C 是相关系数平方的矩阵，是对称半正定的。

当 λ₂=0 时，退化为一般的 Lasso；

当 C 为单位阵时，退化为 elastic-net。

这个优化形式三部分都是凸的，所以这是个凸问题，有唯一的全局最优解。

文章给出了迭代算法：

算法的收敛性：证明了目标函数是非增的（non-increasing），即 L(α^(t+1)) ≤ L(α^(t)) 。

先证明了两个引理。

第一个引理定义了一个辅助函数

并证明 G(β^(t+1)) ≤ G(β^(t))。

第二个引理证明 L(β^(t+1)) - L(β^(t)) ≤ G(β^(t+1)) - G(β^(t)).

结合两个引理得出：L(β^(t+1)) - L(β^(t)) ≤ 0.

接下来，文章讨论了一下特征选择后如何分类。

以二分类为例，得到 β 后，可选取对应绝对值最大的 q 个特征，然后拟合一个一般的最小二乘。

然后用贝叶斯最优决策确定 prediction bound。

然后推导了考虑截距项（intercept term）t 时的算法。

然后讨论了β 初始化的问题。

考虑了 5 种初始化方法，分别是 U(0,1), N(0,1), 1/p, least square, ridge regression。

在 Colon Cancer Data 画出曲线，表明用 ridge regression 初始化收敛最快。

最后在两个基因数据（Colon Cancer Data 和 Leukemia Dataset）上实验。

转载于:https://www.cnblogs.com/shalijiang/p/4249773.html

weixin_30347009

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2013 AAAI: Uncorrelated Lasso

Si-Bao Chen, Chris Ding, Bin Luo and Ying Xie. Uncorrelated Lasso. AAAI, 2013.第一作者是安徽大学陈思宝副教授。第二作者 Chris Ding 是德克萨斯大学阿灵顿分校的教授，Google Scholar 上他引超过 15700 次。这篇文章考虑 Lasso 做特征选择时特征之间的相关性，使选出来的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。