压缩感知的几个问题

最近在看压缩感知稀疏分解的相关内容,对其中的几个概念理解的比较模糊,记录下来
1、稀疏分解的各种字典的关系,首先,字典有超完备字典、完备字典、学习字典,这些字典都是怎么来的呢?如何用一幅图像说明这些字典的来历以及字典中原子的具体含义?
理解:字典的构造有很多方式,就拿一幅图像来说,可以用这幅图像的列向量作为字典的元素,至于选多少个列向量要看自己的选择。此外,对于一类图像来说,比如人脸、遥感图像、自然图像,这种字典除了利用单张图生成字典外,还能用多张图生成过完备字典,这个过完备字典是从多张图像中训练得来的,不是一张图像中的来的。固定字典的话应该就是一幅图片,经过DCT、傅里叶变换之后得到的元素。
2、利用L1范数能够求解稀疏稀疏,能否用一幅图像说明这个过程?
理解:利用范数知识求解系数系数的过程比较抽象,找了许多资料,结合代码基本理解了整个过程。
https://blog.csdn.net/scucj/article/details/7467955[添加链接描述]
这篇博客中详细介绍了MP算法、稀疏表示的过程,对于理解这方面非常有用。
我的理解就是,一幅图像有许多列,我们首先取图像的一列作为研究对象,再用字典和这一列做内积,(字典可以通过上面叙述的方法选取,包括随机选取单幅图像中的任意列、固定字典等)。这里我用的图像是640*960,也就是这幅图像有640行,940列,任意选取940列中的16列作为初始的字典。这个不一定要吧图像中所有的列都作为字典来计算。字典的元素共有16个,将16个原子和图像中的每一列做内积,再取出内积最大原子作为第一个稀疏系数,求出残差,循环进行这一步操作,如果残差小于设定的额阈值就推出,不然就进行16次(因为总共有 16个原子),这样,图像的第一列就能用我们选的字典来表示了。对图像的960列每一列都要进行这种运算,将得到稀疏系数。
3、看了几篇论文,论文中的都是在这里插入图片描述
这种形式的,但是实际图像是二维的,为什么这里只用一维表示?
理解:这种图以前不是很理解,现在理解了一些,左边的X并不是一幅图像,而是图像中的一列,中间的D就是我们要求的字典,右边的a就是稀疏系数。

3、上确界(sup)怎么理解?
理解:简单点来说,上确界就是一个内积的最大值。
4、添加链接描述
这篇博客也是解释MOD算法运行过程的,但是里面有的地方我觉得有问题,比如这里边说X是扁矩阵,所以要先求转置,我研究了好久这句话,想改成不用转置的情况,最后才发现这根本不是转置的问题,而是跟其中的一函数有关,就是regress,这个函数是求线性回归的,在文中假设Y是图像数据,X是系数,文中的目的是通过regress来求字典D,那么用公式就是Y=DX,但是regress函数求解的是Y=DX的X,这个自然和我们的目的相反,所以要在两边先进行转置才能用函数regress。说到底这都是因为Y和X不是方阵造成的,通过将Y改成方阵能够避免这个问题。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值