所处理的图像是数字化图像。数字图像就是能够在计算机上显示和处理的图像。
我们将一幅图像视为一个二维函数f(x,y),其中x和y是空间坐标,而在x-y平面中任意一对空间坐标(x,y)上的幅值f称为该点图像的灰度、亮度或强度。
一个大小为M*N数字图像是由M行N列的有限元素组成的,每个元素都有特定的位置和幅值,代表了其所在行列位置上的图像物理信息,如灰度和色彩等。这些元素称为图像元素或像素。
我们把图像输入计算机后,它“看”到的起始是一组像素值。这些像素值的数量会随图像的大小和分辨率发生改变。如果输入图像是一张JPG格式的彩色图像,它的像素为480*480,那么计算机得到的就是一个大所处理的图像是数字化图像。数字图像就是能够在计算机上显示和处理的图像。
我们将一幅图像视为一个二维函数f(x,y),其中x和y是空间坐标,而在x-y平面中任意一对空间坐标(x,y)上的幅值f称为该点图像的灰度、亮度或强度。
一个大小为M*N数字图像是由M行N列的有限元素组成的,每个元素都有特定的位置和幅值,代表了其所在行列位置上的图像物理信息,如灰度和色彩等。这些元素称为图像元素或像素。
我们把图像输入计算机后,它“看”到的起始是一组像素值。这些像素值的数量会随图像的大小和分辨率发生改变。如果输入图像是一张JPG格式的彩色图像,它的像素为480*480,那么计算机得到的就是一个大小为480*480*3(这里3表示RGB值)的数组。这个数组里的每一个值都介于0-255之间,描述了对应像素的强度。
如果场景
压缩感知主要包括,信号稀疏变换、观测矩阵设计和重构算法三方面。在这里我们主要讨论其重构算法。
压缩感知中的重构操作类似于图像复原。图像复原的主要目的是设法恢复影像获取过程中干扰因素造成的影像质量的退化,从而恢复图像的本来面目。重构是设法恢复影像在压缩观测过程中由观测的稀疏造成的影像质量的退化。
因为我们只考虑图像重构算法的优劣,那么就要确定观测值前的步骤和操作是固定的,即信号的压缩观测过程是不变的。
下面详细讲述如何获得图像的观测值。(附:一张数字图像本身就可看做一个维数很大的矩阵。矩阵中的元素即图像中的像素。)
1. 取单通道图像。得到的是一张图像,下面只考虑灰度图像的处理。所以我们需要将得到的RGB图像转换为YCrbr图像,并只取Y通道,得到单通道的图像。
2. 补零。接下来将进行补零操作。补零,顾名思义,就是将图像的边缘用零填充(0在像素里面是代表着黑,像素范围从0-255,从黑到白)。
3. 非重叠取块。下一步就是将补好零的图像进行非重叠取块,就是将图像(
4. 化为列向量。接下来分别将k个图像小块(大小为
5. 设置采样矩阵。接下来,设置采样矩阵
6. 得到观测值。由公式
参照上图,图像就是一种二维信号。在图像重构中,输入的是图像的观测值,输出的是重构的图像。
关于重构算法,我们考虑使用深度学习中的算法,该算法学习观测值与重构图像之间的数值对应关系。
得到观测值后,普遍的做法是,将采样矩阵转置后乘以每一列观测值得到原始图像块的粗估计(粗估计是我自己的表述),即
我们将深度卷积网络的学习过程理解为学习输入和输出之间的函数映射关系。
值得注意的是,其一,虽然测试集是非重叠分割的,但为了对训练集进行数据扩增以增强训练结果的泛化性,故对训练集中的图片进行了有重叠分割。
其二,对于深度重构后的拼接结果,把拼接痕迹当成某种噪声进行处理,故考虑对拼接的结果进行去噪。