稀疏表示分类(Sparse Representation for Classification,简称SRC)是一项在模式识别和信号处理中应用广泛的技术。它基于这样一个概念:一个信号(比如图像、语音等)可以用一个较大的字典中的一些基向量稀疏地表示。
想象一下,有一个巨大的图书馆(字典),其中每一本书(字典中的基向量)代表了一个特定的模式或特征。如果我们想描述或表达某种特定的信息(信号),在理想的情况下,我们只需要从这个图书馆中借几本相关的书就能够准确地表达出所需的信息。这表示我们使用了一种稀疏的方法,因为我们并没有需要整个图书馆的所有书,而只选择了一小部分。
在SRC中,这个“图书馆”包含了各种各样的features,这些features是从属于不同类别的训练样本中提取出来的。当我们遇到一个新的信号(比如一个待分类的图像)时,我们尝试使用图书馆中的所有书(整个字典)来表达这个新的信号。在最理想的状态下,新信号只会用它真正属于的类别中的一小部分书(即该类别下的训练样本)来表达自己,而其他的书(其他类别的特征)并不会被用到或者只会用到很少一部分。这种表达方式是稀疏的,因为它只涵盖了字典的一小部分。
流程
SRC的工作流程大致如下:
-
创建字典:首先需要一个字典,它由不同类别的训练样本组成。每个类别的样本都会贡献一些“书”,也就是这个大字典的一部分。
-
信号的稀疏表示:当我们有了一个新的信号,比如一个未知分类的图像时,我们尝试找出最少的字典元素,使得它们结合在