基于L2,1范数的特征选择方法

最新推荐文章于 2024-06-18 18:05:08 发布

静守道

最新推荐文章于 2024-06-18 18:05:08 发布

阅读量1.1w

点赞数 4

分类专栏：机器学习文章标签：机器学习 L2_1范数特征选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lqzdreamer/article/details/79678875

版权

机器学习专栏收录该内容

4 篇文章 1 订阅

订阅专栏

本文来自于论文Feiping Nie, Heng Huang, Xiao Cai, Chris H. Q. Ding. Efficient and Robust Feature Selection via Joint L2,1-Norms Minimization,NIPS,pp.1813-1821, 2010的阅读心得总结

该论文提出了一种基于损失函数和正则项的 $L_{2,1}$ 范数来实现一种高效、鲁棒的特征选择方法，并提供了算法分析和收敛性分析。
首先对比了 $L_{1}$ 和 $L_{2}$ 范数的特点：

$L_{1}$ 和 $L_{2}$ 范数表现出一种结构化的正则化技术，但是主要用于二分类；而L2,1范数则是用于多分类
$L_{2}$ 范数对野点非常敏感，基于 $L_{2,1}$ 范数的损失函数能够去除野点
$L_{2}$ 范数倾向于ω 的分量取值尽量均衡，即非零分量个数尽量稠密，而 $L_{0}$ 范数和 $L_{1}$ 范数，则倾向于ω 的分量尽量稀疏，即非苓分量个数尽量少

论文的创新点在于：

受到 $L_{2,1}$ 范数的启发，将 $L_{2,1}$ 范数推广到一般情况，即 $L_{r,p}$ 范数，同时证明了该范数满足范数的三个条件。
相关的讨论为：
将损失函数的优化问题写成一种矩阵的形式，对利用Lagrange对该问题进行了优化，提出了一种比较有效、快速的算法。

首先是，将损失函数的 $L_{2}$ 范数全部转化为 $L_{2,1}$ 范数，即可以同步优化，为后面的优化过程提供了条件。
这里写图片描述
在该最小化目标函数的优化中，等价转化优化问题：

这里写图片描述

更进一步：

这里写图片描述

写成矩阵形式：

这里写图片描述

记：

这里写图片描述

这里写图片描述

即为

这里写图片描述

利用Lagrange方法，转化为：
这里写图片描述

这里写图片描述

求导（相关求导公式可以查看另外一篇博客）矩阵L2,1范数及矩阵L2,p范数的求导：
这里写图片描述

这里写图片描述

其中

这里写图片描述

是对角阵，即有：

这里写图片描述

结合上式即有

这里写图片描述

此时U即为全局最优解，由于D矩阵中包含有U，因此需要迭代求解。算法步骤为：
这里写图片描述

这里写图片描述

关于迭代求解的收敛性证明（证明过程看论文），主要运用了引理：
这里写图片描述

这里写图片描述

同时，将该优化问题推广到更一般的情况（D仍为对角阵，f(U)是凸函数）：
这里写图片描述

这里写图片描述

迭代式：

这里写图片描述

该算法对基因组和蛋白质组生物标志物进行了实验，取得了高效、高准确度的效果。

关注

4
点赞
踩
44

收藏

觉得还不错? 一键收藏
1
评论
基于L2,1范数的特征选择方法

本文来自于论文Feiping Nie, Heng Huang, Xiao Cai, Chris H. Q. Ding. Efficient and Robust Feature Selection via Joint L2,1-Norms Minimization,NIPS,pp.1813-1821, 2010的阅读心得总结该论文提出了一种基于损失函数和正则项的L2,1L2,1L_{2...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。