I introduction
本文工作:
我们开发了一个简单有效的方法,叫做LRR,在一些类似于行为分割,图像聚类,人脸识别,显著检验的应用上可以实现state-of-the-art的性能。
我们的工作从一个子空间恢复干扰数据延伸到了多个子空间。相比于文献【20】需要已知子空间的基才能处理corrupted data的方法,我们的方法具有自主性,i.e.不需要附加的clean data
II Related work
大致可以分为四种:混合高斯,因子分解,线性代数和谱类型的方法。
基于分解的方法近似于将给定的数据矩阵看做两个矩阵的product,因此因子之一可以揭示样本的聚类属性。
作为一种聚类问题,子空间聚类可以首先根据given data学习到一个affinity matrix,然后应用NCut之类的谱聚类方法得到最终的聚类结果。这些不同的spectral-type methods的不同之处就是学习这个affinity matrix的方式不同。
III Preliminaries and problem statement
一些术语:
block-diagonal matrix:形如(1)式的矩阵,一个矩阵本身不是块对角,若可以通过变换成为块对角,也称它是块对角的
union and sum of subspaces:
eg:XOY平面和XOZ平面的和是R3空间,XOY平面和XOZ平面的并只是两个平面
independent(and disjoint) subspaces:
对于k个子空间,当且仅当他们的交集只有{0}时,我们称这k个空间是独立的。当子空间维度是低秩的且总空间维度高时,独立大致等价于成对不相交。
full SVD and skinny SVD:
pseudoinverse:
column space and row space:
affinity degree:
IV. LOW-RANK REPRESENTATION FOR MATRIXRECOVERY
A是一个字典,它线性张成了数据空间得到Z,E的最优解Z*,E*后就可以由AZ*或X-E*获得原始的数据了。因为rank(AZ*)≤rank(Z*),所以AZ*也是原始数据X0的一个低秩恢复。
由于秩函数离散的本质,4式很难求解,而且解可能也不是唯一的,因此用核函数来代替,就得到了凸优化问题(5)