压缩感知算法_再理压缩感知

本文探讨了压缩感知在图像处理中的应用,尤其是图像重构算法。首先介绍了数字图像的基本概念,然后阐述了压缩感知的重构过程,包括信号稀疏变换、观测矩阵设计和重构算法。特别强调了深度学习在图像重构中的作用,利用深度卷积网络学习观测值与重构图像的关系,并讨论了数据扩增和去噪处理的策略。
摘要由CSDN通过智能技术生成

所处理的图像是数字化图像。数字图像就是能够在计算机上显示和处理的图像。

我们将一幅图像视为一个二维函数f(x,y),其中x和y是空间坐标,而在x-y平面中任意一对空间坐标(x,y)上的幅值f称为该点图像的灰度、亮度或强度。

一个大小为M*N数字图像是由M行N列的有限元素组成的,每个元素都有特定的位置和幅值,代表了其所在行列位置上的图像物理信息,如灰度和色彩等。这些元素称为图像元素或像素。

我们把图像输入计算机后,它“看”到的起始是一组像素值。这些像素值的数量会随图像的大小和分辨率发生改变。如果输入图像是一张JPG格式的彩色图像,它的像素为480*480,那么计算机得到的就是一个大所处理的图像是数字化图像。数字图像就是能够在计算机上显示和处理的图像。

我们将一幅图像视为一个二维函数f(x,y),其中x和y是空间坐标,而在x-y平面中任意一对空间坐标(x,y)上的幅值f称为该点图像的灰度、亮度或强度。

一个大小为M*N数字图像是由M行N列的有限元素组成的,每个元素都有特定的位置和幅值,代表了其所在行列位置上的图像物理信息,如灰度和色彩等。这些元素称为图像元素或像素。

我们把图像输入计算机后,它“看”到的起始是一组像素值。这些像素值的数量会随图像的大小和分辨率发生改变。如果输入图像是一张JPG格式的彩色图像,它的像素为480*480,那么计算机得到的就是一个大小为480*480*3(这里3表示RGB值)的数组。这个数组里的每一个值都介于0-255之间,描述了对应像素的强度。

如果场景

在一个固定变换基
下是近似或完全稀疏的,压缩感知理论能以高概率从较少的观测值重构出高分辨率图像。只要变换基
,与测量矩阵非相干。因此通过求解下面优化问题可以重构

9d089082fbf32623592edba99aa5a0ef.png
测量矩阵的维数关系

56073208997be305d1be6214a7852694.png
压缩感知编解码框图

压缩感知主要包括,信号稀疏变换、观测矩阵设计和重构算法三方面。在这里我们主要讨论其重构算法。

压缩感知中的重构操作类似于图像复原。图像复原的主要目的是设法恢复影像获取过程中干扰因素造成的影像质量的退化,从而恢复图像的本来面目。重构是设法恢复影像在压缩观测过程中由观测的稀疏造成的影像质量的退化。

因为我们只考虑图像重构算法的优劣,那么就要确定观测值前的步骤和操作是固定的,即信号的压缩观测过程是不变的。

下面详细讲述如何获得图像的观测值。(附:一张数字图像本身就可看做一个维数很大的矩阵。矩阵中的元素即图像中的像素。)

1. 取单通道图像。得到的是一张图像,下面只考虑灰度图像的处理。所以我们需要将得到的RGB图像转换为YCrbr图像,并只取Y通道,得到单通道的图像。

2. 补零。接下来将进行补零操作。补零,顾名思义,就是将图像的边缘用零填充(0在像素里面是代表着黑,像素范围从0-255,从黑到白)。

3. 非重叠取块。下一步就是将补好零的图像进行非重叠取块,就是将图像(

)按照固定大小
划分为大小一致的块(k个块)。如果图像的size整除不了设定的值,就会产生大小不一的块。上一步的补零就是为了在非重叠取块中能够刚好取完。

4. 化为列向量。接下来分别将k个图像小块(大小为

,这里假设B为33)依次向量化为列向量
,列向量大小为(1089,1),其中,1089=33X33。

5. 设置采样矩阵。接下来,设置采样矩阵

。采样矩阵选定为高斯随机矩阵(也可为高斯随机矩阵行向量正交化后得到的矩阵)。其中采样矩阵的行数为采样率乘以1089,例如,采样率为0.1,那么其采样矩阵大小为(109,1089),109是由0.1乘以1089四舍五入得到。由此,不同采样率得到的采样矩阵也不一样。

6. 得到观测值。由公式

得到图像小块的观测值,
大小为(109,1089),
大小为(1089,1),故,图像小块的观测值
大小为(109,1)。将k个观测值一次从左向右排列得到整张图像的观测值Y,大小为(109,k)。

e4bca46f321e4bd0b20cd7538d0fdfae.png
图像块在采样和初步重构时的变换,采样率为10%

参照上图,图像就是一种二维信号。在图像重构中,输入的是图像的观测值,输出的是重构的图像。

关于重构算法,我们考虑使用深度学习中的算法,该算法学习观测值与重构图像之间的数值对应关系。

得到观测值后,普遍的做法是,将采样矩阵转置后乘以每一列观测值得到原始图像块的粗估计(粗估计是我自己的表述),即

大小为(1089,109),
大小为(109,1)这个
大小为(1089,1),再将
reshape一下变成大小为(33,33)的矩阵。该矩阵可视为初步重构的图像块。将k个图像块按照次序拼接起来得到初步重构的图像。当然这个图像拼接起来后,和原图像差异特别大。所以还需要对该图像进行深度重构,即通过卷积网络得到高质量的重构图像。

我们将深度卷积网络的学习过程理解为学习输入和输出之间的函数映射关系。

值得注意的是,其一,虽然测试集是非重叠分割的,但为了对训练集进行数据扩增以增强训练结果的泛化性,故对训练集中的图片进行了有重叠分割。

其二,对于深度重构后的拼接结果,把拼接痕迹当成某种噪声进行处理,故考虑对拼接的结果进行去噪。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值