压缩感知的几个问题

最新推荐文章于 2023-05-11 14:42:15 发布

天马行空工作坊

最新推荐文章于 2023-05-11 14:42:15 发布

阅读量961

点赞数

分类专栏：稀疏表达文章标签：机器学习深度学习 matlab

本文链接：https://blog.csdn.net/zhangxiaio1/article/details/106328659

版权

稀疏表达专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最近在看压缩感知稀疏分解的相关内容，对其中的几个概念理解的比较模糊，记录下来
1、稀疏分解的各种字典的关系，首先，字典有超完备字典、完备字典、学习字典，这些字典都是怎么来的呢？如何用一幅图像说明这些字典的来历以及字典中原子的具体含义？
理解：字典的构造有很多方式，就拿一幅图像来说，可以用这幅图像的列向量作为字典的元素，至于选多少个列向量要看自己的选择。此外，对于一类图像来说，比如人脸、遥感图像、自然图像，这种字典除了利用单张图生成字典外，还能用多张图生成过完备字典，这个过完备字典是从多张图像中训练得来的，不是一张图像中的来的。固定字典的话应该就是一幅图片，经过DCT、傅里叶变换之后得到的元素。
2、利用L1范数能够求解稀疏稀疏，能否用一幅图像说明这个过程？
理解：利用范数知识求解系数系数的过程比较抽象，找了许多资料，结合代码基本理解了整个过程。
https://blog.csdn.net/scucj/article/details/7467955[添加链接描述]
这篇博客中详细介绍了MP算法、稀疏表示的过程，对于理解这方面非常有用。
我的理解就是，一幅图像有许多列，我们首先取图像的一列作为研究对象，再用字典和这一列做内积，（字典可以通过上面叙述的方法选取，包括随机选取单幅图像中的任意列、固定字典等）。这里我用的图像是640*960，也就是这幅图像有640行，940列，任意选取940列中的16列作为初始的字典。这个不一定要吧图像中所有的列都作为字典来计算。字典的元素共有16个，将16个原子和图像中的每一列做内积，再取出内积最大原子作为第一个稀疏系数，求出残差，循环进行这一步操作，如果残差小于设定的额阈值就推出，不然就进行16次（因为总共有 16个原子），这样，图像的第一列就能用我们选的字典来表示了。对图像的960列每一列都要进行这种运算，将得到稀疏系数。
3、看了几篇论文，论文中的都是在这里插入图片描述
这种形式的，但是实际图像是二维的，为什么这里只用一维表示？
理解：这种图以前不是很理解，现在理解了一些，左边的X并不是一幅图像，而是图像中的一列，中间的D就是我们要求的字典，右边的a就是稀疏系数。

3、上确界（sup)怎么理解？
理解：简单点来说，上确界就是一个内积的最大值。
4、添加链接描述
这篇博客也是解释MOD算法运行过程的，但是里面有的地方我觉得有问题，比如这里边说X是扁矩阵，所以要先求转置，我研究了好久这句话，想改成不用转置的情况，最后才发现这根本不是转置的问题，而是跟其中的一函数有关，就是regress，这个函数是求线性回归的，在文中假设Y是图像数据，X是系数，文中的目的是通过regress来求字典D，那么用公式就是Y=DX，但是regress函数求解的是Y=DX的X，这个自然和我们的目的相反，所以要在两边先进行转置才能用函数regress。说到底这都是因为Y和X不是方阵造成的，通过将Y改成方阵能够避免这个问题。

天马行空工作坊

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
压缩感知的几个问题

最近在看压缩感知稀疏分解的相关内容，对其中的几个概念理解的比较模糊，记录下来1、稀疏分解的各种字典的关系，首先，字典有超完备字典、完备字典、学习字典，这些字典都是怎么来的呢？如何用一幅图像说明这些字典的来历以及字典中原子的具体含义？2、利用L1范数能够求解稀疏稀疏，能否用一幅图像说明这个过程？3、看了几篇论文，论文中的都是这种形式的，但是实际图像是二维的，为什么这里只用一维表示？3、上确界（sup)怎么理解，...
复制链接

扫一扫