Learning the parts of objects by non-negative matrix factorization
由于NMF使用非负矩阵来分解原有矩阵(V=WH),因此,在分解时,只会进行“加”操作数据,不会进行减操作,因此在进行因式分解时。W可以当做提取出来的各个相关度不大的特征,也就是其中所说的Basis images和whole faces,而H可以表示编码encoding。
正是因为矩阵为非负的,因此它能够实现parts-based representation。
编码(encoding)(H)表示一张脸(图片)(V),可以表示成Basis images(W)的线性组合。
W为n*r的,H为r*m的,V为n*m的。
其中r的取值应符合(n+m)<nm。
NMF用于文本语义分析(semantic analysis of text documents):
文档集合用矩阵V表示,Viu表示第 u 个文档,词 i 出现的次数。