基于L2,1范数的特征选择方法

本文来自于论文Feiping Nie, Heng Huang, Xiao Cai, Chris H. Q. Ding. Efficient and Robust Feature Selection via Joint L2,1-Norms Minimization,NIPS,pp.1813-1821, 2010的阅读心得总结

该论文提出了一种基于损失函数和正则项的 L2,1 L 2 , 1 范数来实现一种高效、鲁棒的特征选择方法,并提供了算法分析和收敛性分析。
首先对比了 L1 L 1 L2 L 2 范数的特点:

  • L1 L 1 L2 L 2 范数表现出一种结构化的正则化技术,但是主要用于二分类;而L2,1范数则是用于多分类
  • L2 L 2 范数对野点非常敏感,基于 L2,1 L 2 , 1 范数的损失函数能够去除野点
  • L2 L 2 范数倾向于ω 的分量取值尽量均衡,即非零分量个数尽量稠密,而 L0 L 0 范数和 L1 L 1 范数,则倾向于ω 的分量尽量稀疏,即非苓分量个数尽量少

论文的创新点在于:

  • 受到 L2,1 L 2 , 1 范数的启发,将 L2,1 L 2 , 1 范数推广到一般情况,即 Lr,p L r , p 范数,同时证明了该范数满足范数的三个条件。
    相关的讨论为:
    这里写图片描述
  • 将损失函数的优化问题写成一种矩阵的形式,对利用Lagrange对该问题进行了优化,提出了一种比较有效、快速的算法。

首先是,将损失函数的 L2 L 2 范数全部转化为 L2,1 L 2 , 1 范数,即可以同步优化,为后面的优化过程提供了条件。
这里写图片描述
在该最小化目标函数的优化中,等价转化优化问题:

这里写图片描述

更进一步:
这里写图片描述

写成矩阵形式:
这里写图片描述

记: 这里写图片描述 这里写图片描述
即为
这里写图片描述

利用Lagrange方法,转化为:
这里写图片描述

求导(相关求导公式可以查看另外一篇博客) 矩阵L2,1范数及矩阵L2,p范数的求导
这里写图片描述

其中
这里写图片描述

是对角阵,即有:
这里写图片描述

结合上式即有
这里写图片描述

此时U即为全局最优解,由于D矩阵中包含有U,因此需要迭代求解。算法步骤为:
这里写图片描述

关于迭代求解的收敛性证明(证明过程看论文),主要运用了引理:
这里写图片描述

同时,将该优化问题推广到更一般的情况(D仍为对角阵,f(U)是凸函数):
这里写图片描述

迭代式:
这里写图片描述

该算法对基因组和蛋白质组生物标志物进行了实验,取得了高效、高准确度的效果。

  • 4
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值