计算摄影:梯度域的图像处理

学过图像处理的人,对图像梯度的概念应该都不陌生,图像梯度,可以将一个图像值变成一个向量,如下图所示:

在这里插入图片描述

简单来说,就是对像素值,在 x, y 方向进行求导,从而可以得到图像在 x, y 方向的梯度,梯度域的图像处理,就是利用梯度的性质,对图像梯度进行计算,从而达到某些特定的效果,梯度域的图像处理最有名的就是泊松编辑,此外还有 tone-mapping, 图像拼接,图像融合等等,都可以用这种方法来实现。

在介绍梯度域的图像处理的原理之前,我们先来看看几个概念:
梯度,旋度,散度

  • 梯度: 梯度的概念我们应该比较熟悉,梯度是一个向量,会指向变化最大的地方,而梯度大小,表示变化的幅度
  • 散度: 散度的运算对象是向量,散度表示的是向量场中某个点的发散程度,是远离这个点,还是向这个点聚集
  • 旋度: 旋度的运算对象也是向量,旋度表示的是向量场中,以某个点为中心,其周围点绕其旋转的程度。

旋度的表达:

C u r l ( ▽ I ) = ▽ × ▽ I Curl(\triangledown I) = \triangledown \times \triangledown I Curl(I)=×I

散度的表达:

D i v ( ▽ I ) = ▽ ⋅ ▽ I Div(\triangledown I) = \triangledown \cdot \triangledown I Div(I)=I

对于图像来说,两者存在如下的关系:

在这里插入图片描述
在图像处理中,我们知道, I x y = I y x I_{xy} = I_{yx} Ixy=Iyx,因为图像的二阶导和求导顺序是没有关系的,所以图像梯度的旋度为 0,图像的二阶导一般都是用拉普拉斯算子实现。

梯度域的图像处理,一般来说,其 pipeline 如下:
在这里插入图片描述
图片来源于: ICCV 2007 Course – Gradient Domain Manipulation Techniques

最困难的部分,应该是重建部分,假设我们要重建的图像为 I I I,其已知的梯度为 v \mathbf{v} v,那么我们主要就是要解决如下的优化方程:

min ⁡ f ∬ Ω ∣ ▽ f − v ∣ 2 \min_{f} \iint_{\Omega} | \triangledown f - \mathbf{v}|^2 fminΩfv2

其中, ▽ f \triangledown f f 表示待求图像 f f f 的梯度, v \mathbf{v} v 表示已知的梯度,最后可以化简成求解如下的泊松方程:

Δ f = div v \Delta f = \text{div} \mathbf{v} Δf=divv

在这里插入图片描述
其中, Δ f \Delta f Δf 表示图像 f f f 的二阶导数,$ \text{div} \mathbf{v}$ 表示已知梯度的散度,图像的二阶导数,可以用拉普拉斯算子来实现,上面的优化表达式意味着,希望待求图像 f f f 的梯度和已知的梯度处处相等,所以有:

Δ f p = Δ g p \Delta f_p = \Delta g_p Δfp=Δgp

对于离散图像,一个像素点的二阶导,可以用拉普拉斯算子实现:

在这里插入图片描述
对应的 kernel 如下所示:

在这里插入图片描述
如果我们用一个稀疏矩阵来表示 拉普拉斯算子,那么可以得到如下的线性方程组:

A x = b \mathbf{A} \mathbf{x} = \mathbf{b} Ax=b

其中,KaTeX parse error: Expected 'EOF', got '\mahtbf' at position 1: \̲m̲a̲h̲t̲b̲f̲{A} 是拉普拉斯算子组成的稀疏矩阵, x \mathbf{x} x 表示要求的图像,被拉成了一维列向量, b \mathbf{b} b 是已知的梯度的散度,拉成的一维向量,很显然,这是一个非常庞大的矩阵。

梯度,旋度,散度的概念参考了知乎上的解释:
https://www.zhihu.com/question/24074028/answer/26657334

参考文献: computational photograph, CMU 2018 lecture 10
参考文献: ICCV 2007 Course – Gradient Domain Manipulation Techniques
同样参考了:图像处理中的全局优化技术: https://blog.csdn.net/mulinb/article/details/9079645

  • 4
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
以下是一个简单的基于梯度的图像增强示例 Matlab 程序: ```matlab % 读取图像 image = imread('example.jpg'); % 将图像转换为灰度图像 gray_image = rgb2gray(image); % 使用高斯滤波去除噪声 filtered_image = imgaussfilt(gray_image, 2); % 计算图像的梯度 [dx, dy] = gradient(filtered_image); % 计算梯度的幅值和方向 magnitude = sqrt(dx.^2 + dy.^2); direction = atan2(dy, dx); % 对幅值进行归一化 normalized_magnitude = (magnitude - min(magnitude(:))) / (max(magnitude(:)) - min(magnitude(:))); % 对幅值进行平方,以增强边缘 squared_magnitude = normalized_magnitude .^ 2; % 将方向转换为度数 degree_direction = direction * 180 / pi; % 将度数方向离散化为 8 个方向 quantized_direction = floor((degree_direction + 22.5) / 45) * 45; % 将图像分成 8 个梯度方向的子区 subregions = mat2cell(squared_magnitude, size(squared_magnitude, 1) / 8 * ones(1, 8), size(squared_magnitude, 2)); % 计算每个子区的平均幅值和方向 mean_magnitudes = cellfun(@mean, subregions); mean_directions = cellfun(@(x) mode(quantized_direction(x ~= 0)), subregions); % 将平均幅值和方向合并成一个 8 维向量 feature_vector = [mean_magnitudes, mean_directions]; % 显示原始图像和增强后的图像 imshowpair(image, repmat(uint8(255 * normalized_magnitude), [1, 1, 3]), 'montage'); ``` 该程序将输入图像转换为灰度图像,并使用高斯滤波去除噪声。然后,它计算图像的梯度,并将梯度的幅值和方向归一化和离散化。接下来,它将图像分成 8 个梯度方向的子区,并计算每个子区的平均幅值和方向。最后,它将平均幅值和方向合并成一个 8 维向量,并显示原始图像和增强后的图像。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值