使用OpenCV实现离散傅里叶变换(DFT)

使用OpenCV实现离散傅里叶变换(DFT)

傅里叶变换,妈呀这个东东好高级啊!真的高级吗?理解起来还真是有点困难,需要一些高等数学的基础。有了OpenCV,你不理解也没问题,会用就OK!就好比你会用手机打电话和聊天,至于你为什么拥有了孙悟空的千里眼和顺风耳的能力,这就不管了.
以下内容原文来自opencv-4.2.0-docs/4.2.0/d8/d01/tutorial_discrete_fourier_transform.html 如果你的English好,直接找原文看,不用往下看了,免得浪费时间。我翻译这个东西,只是自己的学习心得,不一定正确。
目的

我们将回答并解决下面的问题:
   1.什么是傅立叶变换,为什么要使用它?
   2.在OpenCV中如何做?
   3.学会这些函数的使用: copyMakeBorder(), merge(), dft(), getOptimalDFTSize(), log()和normalize()

什么是傅里叶变换?
傅立叶变换会将图像分解成其正弦和余弦分量。换句话说,它将图像从空间域转换到频率域。这个想法是,任何函数都可以用无限的正弦和余弦函数之和精确地近似。傅立叶变换是一种方法。数学上,二维图像的傅里叶变换为:
在这里插入图片描述
在此,f是其空间域中的图像值,F是其频率域中的F。转换的结果是复数。可以通过实像+虚像或通过振幅+相位图像进行显示。但是,在整个图像处理算法中,仅振幅图像很有趣,因为它包含了我们需要的有关图像几何结构的所有信息。不过,如果您打算以这些形式对图像进行一些修改,然后需要对其进行重新转换,则需要保留振幅和相位这两种形式。
在此示例中,我将展示如何计算和显示傅立叶变换的振幅图像。在数字图像的情况下是离散的。这意味着他们可能会从给定的域值中获取一个值。例如,在基本灰度级中,图像值通常在零到255之间。因此,傅立叶变换也必须是离散类型,从而导致离散傅立叶变换(DFT)。每当需要从几何角度确定图像的结构时,就需要使用此功能。以下是要执行的步骤(输入数据为灰度图像):
放大图像至合适的尺寸
DFT的性能取决于图像大小。对于数字二,三和五的倍数的图像,它往往是最快的。因此,要获得最佳性能,通常最好将边框值填充到图像上以获得具有此类特征的尺寸。所述getOptimalDFTSize()返回该最佳尺寸和我们可以使用copyMakeBorder()函数以展开的图像(放大部分区域的像素值=0)的边界:

    Mat padded;                            //expand input image to optimal size
    int m = getOptimalDFTSize( I.rows );
    int n = getOptimalDFTSize( I.cols ); // on the border add zero values
    copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));

给实像和虚像分配内存

傅立叶变换的结果很复杂。这意味着对于每个图像值,结果是两个图像值(每个分量一个)。而且,频域范围比其空间对应范围大得多。因此,我们通常至少以浮点格式存储这些内容。因此,我们将输入图像转换为此类型,并使用另一个通道将其扩展以容纳复杂值:
进行离散傅立叶变换
可能就地计算(输入与输出相同):

dft(complexI, complexI);            // this way the result may fit in the source matrix

将实像和虚像的值转换为振幅
复数具有一个实数(Re)和一个复数(虚数-Im)部分。DFT的结果是复数。DFT的大小为:
在这里插入图片描述
OPENCV的实现代码:

split(complexI, planes); // planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
Mat magI = planes[0];

切换到对数刻度
事实证明,傅立叶系数的动态范围太大,无法在屏幕上显示。我们有一些无法观察到的小而高的变化值。因此,高值将全部显示为白点,而小值将显示为黑点。为了使用灰度值进行可视化,我们可以将线性比例转换为对数:
在这里插入图片描述

    magI += Scalar::all(1);  // switch to logarithmic scale
    log(magI, magI);

裁剪和重新排列
还记得,第一步,我们扩大了形象吗?好了,是时候丢弃新引入的值了。出于可视化目的,我们还可以重新排列结果的象限,以使原点(零,零)与图像中心相对应。
归一化
出于可视化目的再次进行此操作。现在我们有了幅度,但是这仍然超出了我们的图像显示范围(从零到一)。我们使用cv :: normalize()函数将值标准化到该范围。
**

normalize(magI, magI, 0, 1, NORM_MINMAX); 
// Transform the matrix with float values into a
// viewable image form (float between values 0 and 1).

**
完整的代码:

#include "opencv2/core.hpp"
#include "opencv2/imgproc.hpp"
#include "opencv2/imgcodecs.hpp"
#include "opencv2/highgui.hpp"
#include <iostream>
using namespace cv;
using namespace std;
//DFT 离散傅里叶变换
//E:\MedicalImage\HMBridge.jpg
static void help(char ** argv)
{
    cout << endl
        <<  "This program demonstrated the use of the discrete Fourier transform (DFT). " << endl
        <<  "The dft of an image is taken and it's power spectrum is displayed."  << endl << endl
        <<  "Usage:"                                                                      << endl
        << argv[0] << " [image_name -- default lena.jpg]" << endl << endl;
}
int main(int argc, char ** argv)
{
    help(argv);
    const char* filename = argc >=2 ? argv[1] : "lena.jpg";
    Mat I = imread( samples::findFile( filename ), IMREAD_GRAYSCALE);
    if( I.empty()){
        cout << "Error opening image" << endl;
        return EXIT_FAILURE;
    }
    Mat padded;                            //expand input image to optimal size
    int m = getOptimalDFTSize( I.rows );
    int n = getOptimalDFTSize( I.cols ); // on the border add zero values
    copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));
    Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
    Mat complexI;
    merge(planes, 2, complexI);         // Add to the expanded another plane with zeros
    dft(complexI, complexI);            // this way the result may fit in the source matrix
    // compute the magnitude and switch to logarithmic scale
    // => log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
    split(complexI, planes);                   // planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
    magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
    Mat magI = planes[0];
    magI += Scalar::all(1);                    // switch to logarithmic scale
    log(magI, magI);
    // crop the spectrum, if it has an odd number of rows or columns
    magI = magI(Rect(0, 0, magI.cols & -2, magI.rows & -2));
    // rearrange the quadrants of Fourier image  so that the origin is at the image center
    int cx = magI.cols/2;
    int cy = magI.rows/2;
    Mat q0(magI, Rect(0, 0, cx, cy));   // Top-Left - Create a ROI per quadrant
    Mat q1(magI, Rect(cx, 0, cx, cy));  // Top-Right
    Mat q2(magI, Rect(0, cy, cx, cy));  // Bottom-Left
    Mat q3(magI, Rect(cx, cy, cx, cy)); // Bottom-Right
    Mat tmp;                           // swap quadrants (Top-Left with Bottom-Right)
    q0.copyTo(tmp);
    q3.copyTo(q0);
    tmp.copyTo(q3);
    q1.copyTo(tmp);                    // swap quadrant (Top-Right with Bottom-Left)
    q2.copyTo(q1);
    tmp.copyTo(q2);
    normalize(magI, magI, 0, 1, NORM_MINMAX); // Transform the matrix with float values into a
                                            // viewable image form (float between values 0 and 1).
    imshow("Input Image"       , I   );    // Show the result
    imshow("spectrum magnitude", magI);
    waitKey();
    return EXIT_SUCCESS;
}

观察一下,图像旋转后能谱图也会随着旋转。
Lena的能谱图如下:
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值