12 傅里叶变换
12.1 傅里叶变换相关知识
何为傅里叶变换?
数学家傅里叶认为:
任何连续周期的信号都可以由一组是党的正弦曲线组合而成。
傅里叶变换是信号的分析方法,目的就是要简化问题,而不是将其变复杂,傅里叶选择了正弦波,而没有选择其他波形,是因为正弦波有任何其他波形不具有的特点:**正弦波输入至任何线性系统中,不会产生新的频率成分,输出的仍是正弦波,改变的仅仅是幅值和相位。**用单位幅值的不同频率的正弦波输入至某线性系统,记录其输出正弦波的幅值和频率的关系,就得到该系统的幅频特性,记录输出正弦波的相位和频率的关系,就得到该系统的相频特性。线性系统是自动控制研究的主要对象,我们只要研究系统对正弦波的输入输出关系,就可以知道该系统对任意输入信号的响应。这是傅里叶变换的最主要的意义。
傅里叶变换是将难以处理的时域信号转换成易于分析的频域信号。
时域:时域是真实的世界,是唯一存在的域。从我们出生开始,所接触的这个世界就是随着时间在变化的,如花开花落,四季变换,生老病死等。以时间作为参照来分析动态世界的方法我们称其为时域分析。
频域:**频域它不是真实的,而是一个数学构造。**频域是一个遵循特定规则的数学范畴,也被一些学者称为上帝视角。结合上面对时域的理解,如果时域是运动永不停止的,那么频域就是静止的。 正弦波是频域中唯一存在的波形,这是频域中最重要的规则,即正弦波是对频域的描述,因为频域中的任何波形都可用正弦波合成。
这里有一篇相当好的文章,比较通俗易懂的解释了相关知识,可以参考:傅里叶变换理解
12.2 傅里叶变换的作用
- 高频:变化剧烈的灰度分量。
- 低频:变化缓慢的灰度分量。
滤波:
- 低通滤波器:只保留低频,会使得图像模糊。
- 高通滤波器:只保留高频,会使得图像细节增强。
API:
输入的图像需要先转换成np.float32格式。
- cv2.dft(src, dst=None, flags=None, nonzeroRows=None):正变换
- cv2.idft(src, dst, flags, nonzeroRows):逆变换
- 返回的结果是双通道的(实部和虚部),通常需要转换成图像格式才能展现(0, 255)
- 得到的结果中频率为0的部分会在左上角,通常要转换到中心位置,可以通过shift变换实现
flags列表
标识符名称 | 意义 |
---|---|
cv2.DFT_INVERSE | 用一维或二维逆变换代替默认的正向变换 |
cv2.DFT_SCALE | 缩放比例标识符,输出的结果都会以1/N进行缩放,通常会结合cv2.DFT_INVERSE一起使用 |
cv2.DFT_ROWS | 对输入矩阵的每行进行正向或反向的变换,此标识符可以在处理多种矢量的时候用于减小资源开销,这些处理常常是三维或高维变换等复杂操作 |
cv2.DFT_COMPLEX_OUTPUT | 进行一维或二维实数数组正变换。这样的结果虽然是复数阵列,但拥有复数的共轭对称性(CCS),所以可以被写成一个拥有同样尺寸的实数阵列 |
cv2.DFT_REAL_OUTPUT | 进行一维或二维复数数组反变换。这样的结果通常是一个大小相同的复矩阵。如果输入的矩阵有复数的共轭对称性,便会输出实矩阵 |
- 频谱
# 展示频谱
import cv2
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':
# 读入灰度图像
img = cv2.imread('./cat.jpg', 0)
img_float32 = np.float32(img)
dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
dft_shift = np.fft.fftshift(dft)
#得到灰度图能表示的形式,映射公式
magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:,:,0], dft_shift[:,:,1]))
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(magnitude_spectrum , cmap='gray')
plt.title('Magnitude Spectrum '), plt.xticks([]), plt.yticks([])
plt.show()
结果展示:
- 低通滤波
# 低通滤波
import cv2
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':
# 读入灰度图像
img = cv2.imread('./cat.jpg', 0)
img_float32 = np.float32(img)
dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
dft_shift = np.fft.fftshift(dft)
rows, cols = img.shape
# 中心位置
crow, ccol = int(rows/2), int(cols/2)
# 低通滤波
mask = np.zeros((rows, cols, 2), np.uint8)
mask[crow-30:crow+30, ccol-30:ccol+30] = 1
# IDFT
fshift = dft_shift*mask
# 还原回去
f_ishift = np.fft.ifftshift(fshift)
img_back = cv2.idft(f_ishift)
img_back = cv2.magnitude(img_back[:,:,0], img_back[:,:,1])
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(img_back , cmap='gray')
plt.title('Result'), plt.xticks([]), plt.yticks([])
plt.show()
结果展示:
我们可以明显地发现图像变模糊了。
- 高通滤波
# 高通滤波
import cv2
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':
# 读入灰度图像
img = cv2.imread('./cat.jpg', 0)
img_float32 = np.float32(img)
dft = cv2.dft(img_float32, flags=cv2.DFT_COMPLEX_OUTPUT)
dft_shift = np.fft.fftshift(dft)
rows, cols = img.shape
# 中心位置
crow, ccol = int(rows/2), int(cols/2)
# 高通滤波,唯一区别之处
mask = np.ones((rows, cols, 2), np.uint8)
mask[crow-30:crow+30, ccol-30:ccol+30] = 0
# IDFT
fshift = dft_shift*mask
# 还原回去
f_ishift = np.fft.ifftshift(fshift)
img_back = cv2.idft(f_ishift)
img_back = cv2.magnitude(img_back[:,:,0], img_back[:,:,1])
plt.subplot(121), plt.imshow(img, cmap='gray')
plt.title('Input Image'), plt.xticks([]), plt.yticks([])
plt.subplot(122), plt.imshow(img_back , cmap='gray')
plt.title('Result'), plt.xticks([]), plt.yticks([])
plt.show()
结果展示:
看,猫猫的细节增强了。。。。。。