稀疏表示（Sparse representation）原理理解

最新推荐文章于 2024-07-22 06:00:00 发布

Forever_pupils

最新推荐文章于 2024-07-22 06:00:00 发布

阅读量5.3w

点赞数 213

分类专栏：机器学习文章标签：稀疏表示人脸分类

本文链接：https://blog.csdn.net/Forever_pupils/article/details/88572281

版权

机器学习专栏收录该内容

1 篇文章 3 订阅

订阅专栏

谨以此文献给我最好的朋友

我有一个十分好学的朋友，一起度过了三年的大学时光（大二认识的），最终他选择了工作，我继续读书。最近他很想了解我最近在搞的东西，在此，就发一片博客来简单说明一下自己最近研究的稀疏表示算法。因为本人能力有限，我会尽自己最大的努力将稀疏表示算法讲的清楚简单。此外，博客中避免不了会有一些差错，希望各位大佬理解。

正文

稀疏表示（Sparse Representation）也叫作稀疏编码（Sparse Coding）,就是用字典中元素的线性组合去表示测试样本。

我们现在考虑图片分类问题，如下：

图片分类

现在给定一个任务，在字典中找出10张图片，用这10张图片的一个线性组合去尽可能的表示测试样本，如果是你的话，你会怎么选，你会选10张桌子图片去表示一张狗的图片吗？不会的，你会选10张狗的图片竟可能的描述测试样本。这也就是稀疏表示的过程。表示，就是用字典中的元素（就是字典中的样本）的线性组合尽可能的描述（还原）测试样本。稀疏表示要用尽可能少的字典中的元素去描述测试样本。为什么要稀疏呢？为什么选用的字典中的样本要尽可能少呢？你可以想象对于一个狗的图片，我用大量的字典中桌子的的样本，东补补西凑凑，只要桌子的样本够多，我也是可以用大量桌子图片的线性组合去表示狗这张图片的。所以对字典中选取的样本的数量要求尽可能的少。

然后，我们的任务就是怎么将这个想法，用数学的公式表示出来，然后用计算机编程实现。

对应的数学表示

在图片分类的问题上，通常把一个两维图像，展成一个一维的向量（一般说向量，是列向量），来方便后边的操作。如何将一个二维图像展成一个一维向量呢，很简单，就是以列展开，第一列下边接上第二列，第二列下边接上第三列.....

完整之后就是这样一个情况：

转化为向量

下面我将详细的解释这图途中每一个字母的含义，

$Y_{i}$ 表示的是第i个测试样本（就是上个图中左侧的狗这个测试样本），上边我们提到我们已经将二维图像展成了一个一维图像，在这里 $Y_{i}$ 为N*1的向量，N表示样本的维度。

D表示的是字典（就是上一个图中的字典），这里对字典中的每一个二维图像也展成了一个向量。D是一个N*M的矩阵，N表示样本的维度，所有的样本的维度都是相同的，用图像处理可以很简单的做到。M表示字典中训练样本的个数。

注意这个图中 $D=[\varphi _{1}^{^{T}};\varphi _{2}^{^{T}};...;\varphi _{n}^{^{T}}]$ 的表述是不准确的，实际上应该是 $D=[\varphi _{1},\varphi _{2},...,\varphi _{n},]$ ,其中 $\varphi _{i}$ 表示的是第i类训练样本的训练集，n表示类别总共n类。假设i个类别中训练样本的个数用 $p_{i}$ 表示，那么可以得到n类样本总的样本个数为 $\sum _{1}^{n} p_{i}=M$ 。