特征选择和特征学习中的过完备

最新推荐文章于 2022-09-18 17:28:15 发布

jiang1st

最新推荐文章于 2022-09-18 17:28:15 发布

阅读量8k

点赞数 5

分类专栏： Machine Learning 文章标签：特征选择特征学习过完备稀疏

本文链接：https://blog.csdn.net/jwh_bupt/article/details/9969841

版权

Machine Learning 专栏收录该内容

19 篇文章 9 订阅

订阅专栏

ScSPM的论文中提到了码书的过完备（over-complete）。一开始没有太在意过完备有什么问题，今天想了想把这个概念弄明白了。

特征学习的过程中，假设学习的码书D的大小为M。每个码字的维数为N。每个原始特征Yi的维数也为N。假设原始特征投影到码书上以后的特征向量是Xi（M维的矢量），那么用D和Xi对Yi重建的过程就是：Yi=D*Xi。

coding的过程就变成了已知Yi和D，求Xi的过程了。显然这是一个非齐次方程组求解的问题，方程组有解的条件是rank(D)≤M，其中取等号时方程组有唯一解。过完备的定义是M>>N，所以此时rank(D)≤N<<M，此时方程组有无穷多解。（你可能会问，这和最小化平方误差为目标函数不一样啊！其实求个导，就变成这个方程组了。）这就是过完备造成的问题了。怎么办呢？办法就是对Xi做约束------稀疏的约束，这样Xi就有唯一解了。这就是需要加约束的原因。而为什么是稀疏的约束，这在我前两博客（这里和这里）中稍微介绍过，这里就不再废话。

特征选择的过程，也是一样的。假设此时有n个样本，每个样本有个measurement（这个measurement可以是regression中的output，也可以是classification中的label）。每个样本的特征是p维的，n个样本的特征组成n*p的矩阵A。目标是对这p维特征做一个选择，选择的系数用x记录。此时将如下图所示：