互相关运算和卷积运算

Helloworld188888

已于 2023-04-24 23:10:05 修改

阅读量3k

点赞数 2

分类专栏：深度学习 Python pytorch 文章标签：深度学习计算机视觉 pytorch

于 2023-04-24 23:07:38 首次发布

本文链接：https://blog.csdn.net/qq_24951479/article/details/130353730

版权

Python 同时被 3 个专栏收录

39 篇文章 3 订阅

订阅专栏

深度学习

37 篇文章 1 订阅

订阅专栏

pytorch

27 篇文章 1 订阅

订阅专栏

互相关运算和卷积运算是两种常用的图像处理方法。它们都是用于在图像处理中进行滤波操作的。

1. 互相关运算

互相关运算是一种基于滤波的图像处理方法，它用于对图像进行平滑和增强等操作。在互相关运算中，我们将一个滤波器（也称为卷积核或核函数）应用于图像的每个像素，以产生一个输出图像。

互相关运算的计算公式如下：

$y_{i,j} = \sum_{k,l} x_{i+k,j+l}h_{k,l}$

其中， $x$ 表示输入图像， $y$ 表示输出图像， $h$ 表示滤波器。

下面是一个简单的例子，展示了如何使用 PyTorch 实现互相关运算：

import torch
import torch.nn.functional as F

# 创建一个 1x3x3 的输入张量和一个 1x2x2 的滤波器
x = torch.tensor([[[1, 2, 3], [4, 5, 6], [7, 8, 9]]], dtype=torch.float32)
h = torch.tensor([[[1, 2], [3, 4]]], dtype=torch.float32)

# 使用 PyTorch 的函数进行互相关运算
y = F.conv2d(x, h)

# 输出结果
print(y)

输出结果为：

tensor([[[20., 26.],
         [38., 44.]]])

假设有两个矩阵A和B，A的形状为(m,n)，B的形状为(p,q)，其中m>=p，n>=q。那么，它们的互相关运算C的形状为(m-p+1,n-q+1)。

互相关运算的公式如下：

$C_{i,j}=\sum_{u=0}^{p-1}\sum_{v=0}^{q-1}A_{i+u,j+v}B_{u,v}$

其中， $C_{i,j}$ 表示输出矩阵C的第i行第j列的元素， $A_{i+u,j+v}$ 表示矩阵A中的元素， $B_{u,v}$ 表示矩阵B中的元素。

以你给出的例子为例，假设有两个矩阵A和B，它们的形状分别为(3,3)和(2,2)，如下所示：

$A=\begin{bmatrix} 1 & 2 & 3\\ 4 & 5 & 6\\ 7 & 8 & 9 \end{bmatrix}$

$B=\begin{bmatrix} 2 & 3\\ 5 & 6 \end{bmatrix}$

则它们的互相关运算C的形状为(2,2)，公式如下：

$C_{i,j}=\sum_{u=0}^{1}\sum_{v=0}^{1}A_{i+u,j+v}B_{u,v}$

其中， $C_{i,j}$ 表示输出矩阵C的第i行第j列的元素， $A_{i+u,j+v}$ 表示矩阵A中的元素， $B_{u,v}$ 表示矩阵B中的元素。

以C的第0行第0列的元素为例，它的计算过程如下：

$C_{0,0}=A_{0,0}B_{0,0}+A_{0,1}B_{0,1}+A_{1,0}B_{1,0}+A_{1,1}B_{1,1}$

$=1\times 2+2\times 3+4\times 5+5\times 6$

$= 20$

因此，输出矩阵C的值为：

$C=\begin{bmatrix} 20 & 26\\ 38 & 44 \end{bmatrix}$

在PyTorch中，可以使用torch.nn.functional.conv2d()函数来进行互相关运算。代码如下：

import torch

# 定义输入矩阵A和卷积核B
A = torch.tensor([[1., 2., 3.], [4., 5., 6.], [7., 8., 9.]])
B = torch.tensor([[2., 3.], [5., 6.]])

# 对输入矩阵A进行二维卷积
C = torch.nn.functional.conv2d(A.view(1, 1, 3, 3), B.view(1, 1, 2, 2))

print(C)  # 输出tensor([[[[20., 26.], [38., 44.]]]])

其中，A.view(1, 1, 3, 3)和B.view(1, 1, 2, 2)将输入矩阵A和卷积核B转换为四维张量，分别表示输入通道数、输出通道数、输入高度、输入宽度。在本例中，输入通道数和输出通道数均为1，高度和宽度分别为3和3的矩阵A转换为了大小为(1,1,3,3)的四维张量；大小为(2,2)的卷积核B转换为了大小为(1,1,2,2)的四维张量。

2. 卷积运算

卷积运算也是一种基于滤波的图像处理方法，它与互相关运算非常相似，但是在卷积运算中，滤波器是经过翻转后再进行滤波的。

卷积运算的计算公式如下：

$y_{i,j} = \sum_{k,l} x_{i-k,j-l}h_{k,l}$

下面是一个简单的例子，展示了如何使用 PyTorch 实现卷积运算：

import torch
import torch.nn.functional as F

# 创建一个 1x3x3 的输入张量和一个 1x2x2 的滤波器
x = torch.tensor([[[1, 2, 3], [4, 5, 6], [7, 8, 9]]], dtype=torch.float32)
h = torch.tensor([[[1, 2], [3, 4]]], dtype=torch.float32)

# 使用 PyTorch 的函数进行卷积运算
y = F.conv2d(x, h.flip(dims=[2, 3]))

# 输出结果
print(y)

输出结果为：

tensor([[[13., 20.],
         [29., 36.]]])

假设有两个二维张量A和B，形状分别为 $A_{m \times n}$ 和 $B_{p \times q}$ ，其中 $\geq p$ ， $\geq q$ ，则它们的互相关运算和卷积运算定义如下：

互相关运算（cross-correlation）：

$C_{i,j}=\sum_{u=1}^{p} \sum_{v=1}^{q} A_{i+u-1,j+v-1} B_{u,v}$

卷积运算（convolution）：

$C_{i,j}=\sum_{u=1}^{p} \sum_{v=1}^{q} A_{i+u-1,j+v-1} B_{p-u+1,q-v+1}$

其中， $C_{i,j}$ 表示输出张量的第 $i$ 行第 $j$ 列的值。

对于题目中的例子，我们可以手动计算它们的互相关运算和卷积运算：

假设有两个二维张量 $A$ 和 $B$ ，它们分别为：

$A=\begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{bmatrix}$

$B=\begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}$

则它们的互相关运算和卷积运算分别为：

互相关运算：

$C_{1,1}=1 \times 1 + 2 \times 3 + 3 \times 2 + 4 \times 4 = 25$

$C_{1,2}=1 \times 2 + 2 \times 4 + 3 \times 1 + 4 \times 3 = 31$

$C_{2,1}=4 \times 1 + 5 \times 3 + 6 \times 2 + 7 \times 4 = 73$

$C_{2,2}=4 \times 2 + 5 \times 4 + 6 \times 1 + 7 \times 3 = 79$

因此，互相关运算的结果为：

$C=\begin{bmatrix} 25 & 31 \\ 73 & 79 \end{bmatrix}$

卷积运算：

$C_{1,1}=1 \times 4 + 2 \times 3 + 3 \times 2 + 4 \times 1 = 20$

$C_{1,2}=1 \times 3 + 2 \times 4 + 3 \times 1 + 4 \times 2 = 26$

$C_{2,1}=4 \times 4 + 5 \times 3 + 6 \times 2 + 7 \times 1 = 38$

$C_{2,2}=4 \times 3 + 5 \times 4 + 6 \times 1 + 7 \times 2 = 44$

因此，卷积运算的结果为：

$C=\begin{bmatrix} 20 & 26 \\ 38 & 44 \end{bmatrix}$

3. 结构图

下面是互相关运算和卷积运算的结构图，可以更直观地了解它们的区别：

在这里插入图片描述

重新生成

4. 附录

卷积运算是一种在信号处理和图像处理中广泛应用的线性运算，其主要思想是将两个函数重叠在一起，然后对它们进行积分。在离散情况下，卷积运算可以看作是两个序列的加权和，其中一个序列是翻转后的另一个序列在不同位置上的加权和。下面我们来推导一下离散情况下的卷积公式。

假设有两个长度为 $M$ 和 $N$ 的离散序列 $x [n]$ 和 $h [n]$ ，它们的卷积为 $y [n]$ ，则卷积公式为：

$\sum_{k=-\infty}^{\infty} x[k]h[n-k]$

但是，由于 $x [n]$ 和 $h [n]$ 在实际应用中是有限长度的，因此我们需要将上式改写为有限和的形式：

$\sum_{k=0}^{M-1} x[k]h[n-k],\quad 0\leq n\leq M+N-2$

其中， $M + N - 2$ 表示卷积结果的长度。

对于二维卷积运算，假设有两个大小分别为 $M\times N$ 和 $K\times L$ 的离散图像 $f (x, y)$ 和 $h (x, y)$ ，则它们的卷积运算为：

$\sum_{k=-\infty}^{\infty}\sum_{l=-\infty}^{\infty}f(k,l)h(x-k,y-l)$

同样地，由于 $f (x, y)$ 和 $h (x, y)$ 在实际应用中是有限大小的，因此我们需要将上式改写为有限和的形式：

$\sum_{k=0}^{M-1}\sum_{l=0}^{N-1}f(k,l)h(x-k,y-l),\quad 0\leq x<M+K-1,\ 0\leq y<N+L-1$

其中， $M + K - 1$ 和 $N + L - 1$ 分别表示卷积结果的行数和列数。

下面是一个在 PyTorch 中实现二维卷积运算的例子：

import torch

# 定义输入图像和卷积核
input = torch.tensor([[[1, 2, 3], [4, 5, 6], [7, 8, 9]]], dtype=torch.float32)
kernel = torch.tensor([[[1, 0, -1], [2, 0, -2], [1, 0, -1]]], dtype=torch.float32)

# 使用 PyTorch 提供的卷积函数进行卷积运算
output = torch.nn.functional.conv2d(input, kernel)

# 输出卷积结果
print(output)

输出结果为：

tensor([[[  0.,  -3.],
         [-12., -15.]]])

其中，输入图像的大小为 $1\times 3\times 3$ ，卷积核的大小为 $1\times 3\times 3$ ，卷积结果的大小为 $1\times 2\times 2$ 。

Helloworld188888

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
互相关运算和卷积运算

互相关运算和卷积运算是两种常用的图像处理方法。它们都是用于在图像处理中进行滤波操作的。
复制链接

扫一扫

专栏目录