【OpenCV-Python】教程:3-11 图像变换(频域变换)

OpenCV Python 图像变换

【目标】

  • 利用OpenCV 对图像进行 傅里叶变换
  • 利用NumPy的FFT函数
  • 傅里叶变换的应用
  • cv2.dft(), cv2.idft()

【原理】

傅里叶变换常用于频域图像分析。对于图像来说,2D DFT 常用于寻找频域特征,一个快速算法 FFT(Fast Fourier Transform)用于计算DFT。更详细的资料请查找图像处理或者信号处理和 【参考】

对于正弦信号来说, X ( t ) = A sin ⁡ ( 2 π f t ) X(t)=A\sin(2 \pi f t) X(t)=Asin(2πft), 我们称 f f f 为信号的频率,如果用了频率,那么可以在 f f f 获得波峰。我们可以假设图像是一个二维的信号,可以在 X X X 方向和 Y Y Y 方向进行采样。

更直观的说,对于正弦信号,如果振幅在短时间内变化如此之快,你可以说它是一个高频信号,如果变化缓慢,则为低频信号。可以将相同的想法扩展到图像,图像中的振幅在何处变化剧烈?在边缘点,或噪声。因此,我们可以说,边缘和噪声是图像中的高频内容,如果振幅没有太大变化,则为低频分量。

【代码】

  • NumPy 中的傅里叶变换

我们将了解如何用 NumPy查找傅里叶变换。NumPy中有一个FFT包来实现这一点,np.fft.fft2()给我们提供了一个复数数组,第一个参数是灰度图像,第二个参数是可选的尺寸,如果大于输入,输入填充,如果小于输入,输入裁剪,默认相同。
零频率分量(DC分量)将位于左上角,如果想让它居中,那么就在两个方向上分别移动 N / 2 N/2 N/2,可以通过函数 np.fft.fftshift()完成。
可以看到有很多的白色区域在中心,也就是说有很多低频分量。

在这里插入图片描述

# NumPy 的 FFT
import cv2
import numpy as np
from matplotlib import pyplot as plt

# 读入图像
img = cv2.imread('assets/messi5.jpg', 0)

# fft
f = np.fft.fft2(img)

# 移动到中心
fshift = np.fft.fftshift(f)

# 幅度
magnitude_spectrum = 20*np.log(np.abs(fshift))

# 显示
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')
plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
plt.show()
  • NumPy 中的傅里叶变换应用(高通滤波)

在这里插入图片描述

# NumPy 的 FFT
import cv2
import numpy as np
from matplotlib import pyplot as plt

# 读入图像
img = cv2.imread('assets/messi5.jpg', 0)

# fft
f = np.fft.fft2(img)

# 移动到中心
fshift = np.fft.fftshift(f)

# 低频信号较多部分置0
rows, cols = img.shape
crow,ccol = rows//2 , cols//2
fshift[crow-30:crow+31, ccol-30:ccol+31] = 0

# 逆移动
f_ishift = np.fft.ifftshift(fshift)

# 逆变换
img_back = np.fft.ifft2(f_ishift)

# img_back = np.real(img_back) # 官网此处有误
img_back = np.abs(img_back)


# 显示
plt.subplot(131),plt.imshow(img, cmap = 'gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(132),plt.imshow(img_back, cmap = 'gray')
plt.title('Image after HPF'), plt.xticks([]), plt.yticks([])
plt.subplot(133),plt.imshow(img_back)
plt.title('Result in JET'), plt.xticks([]), plt.yticks([])
plt.show()

如果仔细看结果,尤其是JET图,可以发现一些人工痕迹,这种效果称为“振铃效应”,主要是由矩形窗口的滤波导致的。所以矩形窗口不能用于滤波,最好的选项是高斯窗口。

  • OpenCV 的 dft

在这里插入图片描述

# OpenCV dft
import numpy as np
import cv2
from matplotlib import pyplot as plt

# 读入图像
img = cv2.imread('assets/messi5.jpg', 0)

# 进行 dft 运算
dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT)

# 移动到中心
dft_shift = np.fft.fftshift(dft)

# 计算幅度
magnitude_spectrum = 20 * \
    np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))

# 显示
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(magnitude_spectrum, cmap='gray')
plt.title('Magnitude Spectrum'), plt.xticks([]), plt.yticks([])
plt.show()

  • OpenCV 的 dft 应用(低通滤波)

在这里插入图片描述

# OpenCV dft
import numpy as np
import cv2
from matplotlib import pyplot as plt

# 读入图像
img = cv2.imread('assets/messi5.jpg', 0)

# 进行 dft 运算
dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT)

# 移动到中心
dft_shift = np.fft.fftshift(dft)

rows, cols = img.shape
# crow,ccol = rows/2 , cols/2 # 官网此处代码也有误, 宽高除2不一定是整数
crow, ccol = rows//2, cols//2

# 建立一个mask
mask = np.zeros((rows, cols, 2), np.uint8)
mask[crow-30:crow+31, ccol-30:ccol+31] = 1

# 高频信号置零
fshift = dft_shift * mask
f_ishift = np.fft.ifftshift(fshift)
img_back = cv2.idft(f_ishift)
img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])


plt.subplot(131), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(132), plt.imshow(img_back, cmap='gray')
plt.title('Image After LPF'), plt.xticks([]), plt.yticks([])
plt.subplot(133), plt.imshow(img_back)
plt.title('Result in JET'), plt.xticks([]), plt.yticks([])
plt.show()
  • DFT 的优化

DFT 计算对某些维度的数组效果更好,当尺寸为2的幂时,速度最快。当尺寸为2、3、5的乘积依然处理更有效。所以,可以在计算DFT之前获得比较好的尺寸(图像可以补零)进行DFT计算。对于OpenCV来说,需要手动补,对于NumPy来说,自动补零。

import numpy as np
import cv2
from matplotlib import pyplot as plt

# 读入图像
img = cv2.imread('assets/messi5.jpg', 0)

rows, cols = img.shape
print("{} {}".format(rows, cols))
nrows = cv2.getOptimalDFTSize(rows)
ncols = cv2.getOptimalDFTSize(cols)
print("{} {}".format(nrows, ncols))
342 548
360 576

【接口】

  • dft
cv2.dft(	src[, dst[, flags[, nonzeroRows]]]	) ->	dst

对浮点数组执行正和逆离散傅里叶变换

  • src: 输入数组,实数或复数
  • dst: 输出数组,尺寸和类型取决于flag
  • flags: 参数,变换的标识
  • nonzeroRows: 当参数不为零时,该函数假设只有输入阵列的第一个非零行(未设置DFT_INVERSE)或只有输出阵列的第一非零行(设置DFT_REVERSE)包含非零,因此,该函数可以更有效地处理其余行并节省一些时间;该技术对于使用DFT计算阵列互相关或卷积非常有用。
  • dft flags
    在这里插入图片描述

  • idft

cv2.dft(	src[, dst[, flags[, nonzeroRows]]]	) ->	dst

对浮点数组执行逆离散傅里叶变换

  • src: 输入数组,实数或复数
  • dst: 输出数组,尺寸和类型取决于flag
  • flags: 参数,变换的标识
  • nonzeroRows: 当参数不为零时,该函数假设只有输入阵列的第一个非零行(未设置DFT_INVERSE)或只有输出阵列的第一非零行(设置DFT_REVERSE)包含非零,因此,该函数可以更有效地处理其余行并节省一些时间;该技术对于使用DFT计算阵列互相关或卷积非常有用。
  • magnitude
cv2.magnitude(	x, y[, magnitude]	) ->	magnitude

d s t ( I ) = x ( I ) 2 + y ( I ) 2 dst(I)=\sqrt{x(I)^2+y(I)^2} dst(I)=x(I)2+y(I)2

计算 幅度

  • x: x坐标的浮点数组
  • y: y坐标的浮点数组
  • magnitude: 输出的幅度

【参考】

  1. OpenCV官方文档
  2. An Intuitive Explanation of Fourier Theory by Steven Lehar
  3. Fourier Transform at HIPR
  4. What does frequency domain denote in case of images?
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 傅里叶变换是一种将信号从时转换到的数学方法。在图像处理中,傅里叶变换可以用来分析图像率特征,例如图像中的边缘和纹理。Python中的OpenCV库提供了傅里叶变换的实现,可以通过调用cv2.dft()函数来进行傅里叶变换。傅里叶变换可以用于图像增强、滤波和压缩等应用。 ### 回答2: Python OpenCV库提供了傅里叶变换函数来进行图像处理。傅里叶变换图像信号转换成信号,可以用来分析和处理图像谱信息。它是基于傅里叶分析原理设计的一种算法,可以将信号分解为不同率成分的叠加,从而对信号进行分析。 在OpenCV中使用傅里叶变换需要首先导入库和读入图像,然后通过函数cv2.dft()对图像进行傅里叶变换。此外,为了更好地展示信息,还需要进行幅度和相位的变换,通过cv2.magnitude()和cv2.phase()函数,我们可以获取傅里叶变换的幅度和相位。 图像的傅里叶变换进行后,我们可以对结果进行谱分析和滤波。通过将图像转回到空图像,使用cv2.idft()函数可以得到图像的逆变换。 傅里叶变换是数字信号处理中的一种重要工具,广泛应用于图像、音等领。在图像处理方面,傅里叶变换可以帮助我们分析图像谱分布,对图像进行滤波、增强和压缩等操作,从而得到更好的图像效果。例如,我们可以使用低通滤波器去除图像中的高噪声,使用高通滤波器去除低信号,得到更高质量的图像。 总结起来,Python OpenCV中的傅里叶变换图像处理中的重要工具,可以用于对图像进行分析、滤波和增强等操作。它是数字信号处理的一种基础算法,应用广泛,具有广泛的应用前景。 ### 回答3: Python OpenCV中的傅里叶变换是一个非常强大的工具,被广泛应用于图像和信号处理领。傅里叶变换主要是将一个函数在时的表示转换为在的表示,进而分析该函数中所包含的各个率成分的强弱和相位信息。 Python OpenCV中实现傅里叶变换有两种方法:一种是使用numpy中的fft库,另一种是使用OpenCV自带的dft函数。 对于使用numpy中的fft库,需要先对图像进行二维傅里叶变换,并对谱进行平移操作。代码如下: ``` import cv2 import numpy as np img = cv2.imread("test.jpg", 0) dft = np.fft.fft2(img) dft_shift = np.fft.fftshift(dft) magnitude_spectrum = 20 * np.log(np.abs(dft_shift)) cv2.imshow("Magnitude Spectrum", magnitude_spectrum) cv2.waitKey(0) cv2.destroyAllWindows() ``` 其中读取图像的方法可以通过cv2.imread()实现,0表示以灰度图像的方式读取;将图像进行二维傅里叶变换则是通过numpy中的fft.fft2()实现的;谱平移则是通过numpy中的fft.fftshift()实现的;最后再通过20*np.log(np.abs())计算幅值谱,并将其图像化。这里的20*np.log()是为了将幅度值转为对数尺度,更好地显示出谱中的差异。 另一种实现傅里叶变换的方法是在OpenCV中使用dft函数。这种方法与使用numpy的fft库的区别在于dft函数返回的是一个复数矩阵,需要取其幅度值并进行平移操作。代码如下: ``` import cv2 import numpy as np img = cv2.imread("test.jpg", 0) dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT) dft_shift = np.fft.fftshift(dft) magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1])) cv2.imshow("Magnitude Spectrum", magnitude_spectrum) cv2.waitKey(0) cv2.destroyAllWindows() ``` 需要注意的是,需要将读取的图像转换为float32类型,并设置dft函数的flags参数为cv2.DFT_COMPLEX_OUTPUT。最后通过cv2.magnitude()函数计算幅值谱,实现图像化显示。 总的来说,Python OpenCV中的傅里叶变换是一项极其有用的功能,可以帮助我们更好地分析图像特征。当然,我们还可以进一步进行傅里叶变换的逆变换,将的表示恢复到时的表示。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黄金旺铺

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值