OpenCV初尝试12——傅里叶变换

最新推荐文章于 2023-10-27 21:14:09 发布

胵恦

最新推荐文章于 2023-10-27 21:14:09 发布

阅读量2.5k

点赞数 1

分类专栏： OpenCV 文章标签： opencv python

本文链接：https://blog.csdn.net/m0_59021811/article/details/124040390

版权

OpenCV 专栏收录该内容

19 篇文章 3 订阅

订阅专栏

12 傅里叶变换

12.1 傅里叶变换相关知识

何为傅里叶变换？
数学家傅里叶认为：
任何连续周期的信号都可以由一组是党的正弦曲线组合而成。
傅里叶变换是信号的分析方法，目的就是要简化问题，而不是将其变复杂，傅里叶选择了正弦波，而没有选择其他波形，是因为正弦波有任何其他波形不具有的特点：**正弦波输入至任何线性系统中，不会产生新的频率成分，输出的仍是正弦波，改变的仅仅是幅值和相位。**用单位幅值的不同频率的正弦波输入至某线性系统，记录其输出正弦波的幅值和频率的关系，就得到该系统的幅频特性，记录输出正弦波的相位和频率的关系，就得到该系统的相频特性。线性系统是自动控制研究的主要对象，我们只要研究系统对正弦波的输入输出关系，就可以知道该系统对任意输入信号的响应。这是傅里叶变换的最主要的意义。

傅里叶变换是将难以处理的时域信号转换成易于分析的频域信号。
时域：时域是真实的世界，是唯一存在的域。从我们出生开始，所接触的这个世界就是随着时间在变化的，如花开花落，四季变换，生老病死等。以时间作为参照来分析动态世界的方法我们称其为时域分析。
频域：**频域它不是真实的，而是一个数学构造。**频域是一个遵循特定规则的数学范畴，也被一些学者称为上帝视角。结合上面对时域的理解，如果时域是运动永不停止的，那么频域就是静止的。正弦波是频域中唯一存在的波形，这是频域中最重要的规则，即正弦波是对频域的描述，因为频域中的任何波形都可用正弦波合成。

这里有一篇相当好的文章，比较通俗易懂的解释了相关知识，可以参考：傅里叶变换理解

12.2 傅里叶变换的作用

高频：变化剧烈的灰度分量。
低频：变化缓慢的灰度分量。

滤波：

低通滤波器：只保留低频，会使得图像模糊。
高通滤波器：只保留高频，会使得图像细节增强。

API：
输入的图像需要先转换成np.float32格式。

cv2.dft(src, dst=None, flags=None, nonzeroRows=None)：正变换
cv2.idft(src, dst, flags, nonzeroRows)：逆变换
返回的结果是双通道的（实部和虚部），通常需要转换成图像格式才能展现(0, 255)
得到的结果中频率为0的部分会在左上角，通常要转换到中心位置，可以通过shift变换实现

flags列表

标识符名称	意义
cv2.DFT_INVERSE	用一维或二维逆变换代替默认的正向变换
cv2.DFT_SCALE	缩放比例标识符，输出的结果都会以1/N进行缩放，通常会结合cv2.DFT_INVERSE一起使用
cv2.DFT_ROWS	对输入矩阵的每行进行正向或反向的变换，此标识符可以在处理多种矢量的时候用于减小资源开销，这些处理常常是三维或高维变换等复杂操作
cv2.DFT_COMPLEX_OUTPUT	进行一维或二维实数数组正变换。这样的结果虽然是复数阵列，但拥有复数的共轭对称性（CCS），所以可以被写成一个拥有同样尺寸的实数阵列
cv2.DFT_REAL_OUTPUT	进行一维或二维复数数组反变换。这样的结果通常是一个大小相同的复矩阵。如果输入的矩阵有复数的共轭对称性，便会输出实矩阵

频谱

# 展示频谱
import cv2
import numpy as np
import matplotlib.pyplot as plt

if __name__ == '__main__':
	# 读入灰度图像
	img = cv2.imread('./cat.jpg', 0)
	img_float32 = np.float32(img)
	dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
	dft_shift = np.fft.fftshift(dft)
	#得到灰度图能表示的形式，映射公式
	magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:,:,0], dft_shift[:,:,1]))
	plt.subplot(121), plt.imshow(img, cmap='gray')
	plt.title('Input Image'), plt.xticks([]), plt.yticks([])
	plt.subplot(122), plt.imshow(magnitude_spectrum , cmap='gray')
	plt.title('Magnitude Spectrum '), plt.xticks([]), plt.yticks([])
	plt.show()

结果展示：
在这里插入图片描述

低通滤波

# 低通滤波
import cv2
import numpy as np
import matplotlib.pyplot as plt

if __name__ == '__main__':
	# 读入灰度图像
	img = cv2.imread('./cat.jpg', 0)
	img_float32 = np.float32(img)
	dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
	dft_shift = np.fft.fftshift(dft)

	rows, cols = img.shape
	# 中心位置
	crow, ccol = int(rows/2), int(cols/2)

	# 低通滤波
	mask = np.zeros((rows, cols, 2), np.uint8)
	mask[crow-30:crow+30, ccol-30:ccol+30] = 1
	
	# IDFT
	fshift = dft_shift*mask
	# 还原回去
	f_ishift = np.fft.ifftshift(fshift)
	img_back = cv2.idft(f_ishift)
	img_back = cv2.magnitude(img_back[:,:,0], img_back[:,:,1])
	
	plt.subplot(121), plt.imshow(img, cmap='gray')
	plt.title('Input Image'), plt.xticks([]), plt.yticks([])
	plt.subplot(122), plt.imshow(img_back , cmap='gray')
	plt.title('Result'), plt.xticks([]), plt.yticks([])
	plt.show()

结果展示：
我们可以明显地发现图像变模糊了。
在这里插入图片描述

高通滤波

# 高通滤波
import cv2
import numpy as np
import matplotlib.pyplot as plt

if __name__ == '__main__':
	# 读入灰度图像
	img = cv2.imread('./cat.jpg', 0)
	img_float32 = np.float32(img)
	dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
	dft_shift = np.fft.fftshift(dft)

	rows, cols = img.shape
	# 中心位置
	crow, ccol = int(rows/2), int(cols/2)

	# 高通滤波，唯一区别之处
	mask = np.ones((rows, cols, 2), np.uint8)
	mask[crow-30:crow+30, ccol-30:ccol+30] = 0
	
	# IDFT
	fshift = dft_shift*mask
	# 还原回去
	f_ishift = np.fft.ifftshift(fshift)
	img_back = cv2.idft(f_ishift)
	img_back = cv2.magnitude(img_back[:,:,0], img_back[:,:,1])
	
	plt.subplot(121), plt.imshow(img, cmap='gray')
	plt.title('Input Image'), plt.xticks([]), plt.yticks([])
	plt.subplot(122), plt.imshow(img_back , cmap='gray')
	plt.title('Result'), plt.xticks([]), plt.yticks([])
	plt.show()