使用OpenCV实现离散傅里叶变换（DFT）

最新推荐文章于 2024-07-04 10:55:18 发布

qq_67259275

最新推荐文章于 2024-07-04 10:55:18 发布

阅读量491

点赞数 2

文章标签：傅立叶分析 opencv

本文链接：https://blog.csdn.net/qq_23313467/article/details/105159043

版权

使用OpenCV实现离散傅里叶变换（DFT）

傅里叶变换，妈呀这个东东好高级啊！真的高级吗？理解起来还真是有点困难，需要一些高等数学的基础。有了OpenCV，你不理解也没问题，会用就OK！就好比你会用手机打电话和聊天，至于你为什么拥有了孙悟空的千里眼和顺风耳的能力，这就不管了.
以下内容原文来自opencv-4.2.0-docs/4.2.0/d8/d01/tutorial_discrete_fourier_transform.html 如果你的English好，直接找原文看，不用往下看了，免得浪费时间。我翻译这个东西，只是自己的学习心得，不一定正确。
目的

我们将回答并解决下面的问题：
   1.什么是傅立叶变换，为什么要使用它？
   2.在OpenCV中如何做？
   3.学会这些函数的使用: copyMakeBorder(), merge(), dft(), getOptimalDFTSize(), log()和normalize()。

什么是傅里叶变换？
傅立叶变换会将图像分解成其正弦和余弦分量。换句话说，它将图像从空间域转换到频率域。这个想法是，任何函数都可以用无限的正弦和余弦函数之和精确地近似。傅立叶变换是一种方法。数学上，二维图像的傅里叶变换为：
在这里插入图片描述
在此，f是其空间域中的图像值，F是其频率域中的F。转换的结果是复数。可以通过实像+虚像或通过振幅+相位图像进行显示。但是，在整个图像处理算法中，仅振幅图像很有趣，因为它包含了我们需要的有关图像几何结构的所有信息。不过，如果您打算以这些形式对图像进行一些修改，然后需要对其进行重新转换，则需要保留振幅和相位这两种形式。
在此示例中，我将展示如何计算和显示傅立叶变换的振幅图像。在数字图像的情况下是离散的。这意味着他们可能会从给定的域值中获取一个值。例如，在基本灰度级中，图像值通常在零到255之间。因此，傅立叶变换也必须是离散类型，从而导致离散傅立叶变换（DFT）。每当需要从几何角度确定图像的结构时，就需要使用此功能。以下是要执行的步骤（输入数据为灰度图像）：
放大图像至合适的尺寸
DFT的性能取决于图像大小。对于数字二，三和五的倍数的图像，它往往是最快的。因此，要获得最佳性能，通常最好将边框值填充到图像上以获得具有此类特征的尺寸。所述getOptimalDFTSize（）返回该最佳尺寸和我们可以使用copyMakeBorder（）函数以展开的图像（放大部分区域的像素值=0）的边界：

    Mat padded;                            //expand input image to optimal size
    int m = getOptimalDFTSize( I.rows );
    int n = getOptimalDFTSize( I.cols ); // on the border add zero values
    copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));

给实像和虚像分配内存

傅立叶变换的结果很复杂。这意味着对于每个图像值，结果是两个图像值（每个分量一个）。而且，频域范围比其空间对应范围大得多。因此，我们通常至少以浮点格式存储这些内容。因此，我们将输入图像转换为此类型，并使用另一个通道将其扩展以容纳复杂值：
进行离散傅立叶变换
可能就地计算（输入与输出相同）：

dft(complexI, complexI);            // this way the result may fit in the source matrix

将实像和虚像的值转换为振幅
复数具有一个实数（Re）和一个复数（虚数-Im）部分。DFT的结果是复数。DFT的大小为：
在这里插入图片描述
OPENCV的实现代码：

split(complexI, planes); // planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
Mat magI = planes[0];

切换到对数刻度
事实证明，傅立叶系数的动态范围太大，无法在屏幕上显示。我们有一些无法观察到的小而高的变化值。因此，高值将全部显示为白点，而小值将显示为黑点。为了使用灰度值进行可视化，我们可以将线性比例转换为对数：
在这里插入图片描述

    magI += Scalar::all(1);  // switch to logarithmic scale
    log(magI, magI);

裁剪和重新排列
还记得，第一步，我们扩大了形象吗？好了，是时候丢弃新引入的值了。出于可视化目的，我们还可以重新排列结果的象限，以使原点（零，零）与图像中心相对应。
归一化
出于可视化目的再次进行此操作。现在我们有了幅度，但是这仍然超出了我们的图像显示范围（从零到一）。我们使用cv :: normalize（）函数将值标准化到该范围。
**

normalize(magI, magI, 0, 1, NORM_MINMAX); 
// Transform the matrix with float values into a
// viewable image form (float between values 0 and 1).

**
完整的代码：

#include "opencv2/core.hpp"
#include "opencv2/imgproc.hpp"
#include "opencv2/imgcodecs.hpp"
#include "opencv2/highgui.hpp"
#include <iostream>
using namespace cv;
using namespace std;
//DFT 离散傅里叶变换
//E:\MedicalImage\HMBridge.jpg
static void help(char ** argv)
{
    cout << endl
        <<  "This program demonstrated the use of the discrete Fourier transform (DFT). " << endl
        <<  "The dft of an image is taken and it's power spectrum is displayed."  << endl << endl
        <<  "Usage:"                                                                      << endl
        << argv[0] << " [image_name -- default lena.jpg]" << endl << endl;
}
int main(int argc, char ** argv)
{
    help(argv);
    const char* filename = argc >=2 ? argv[1] : "lena.jpg";
    Mat I = imread( samples::findFile( filename ), IMREAD_GRAYSCALE);
    if( I.empty()){
        cout << "Error opening image" << endl;
        return EXIT_FAILURE;
    }
    Mat padded;                            //expand input image to optimal size
    int m = getOptimalDFTSize( I.rows );
    int n = getOptimalDFTSize( I.cols ); // on the border add zero values
    copyMakeBorder(I, padded, 0, m - I.rows, 0, n - I.cols, BORDER_CONSTANT, Scalar::all(0));
    Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
    Mat complexI;
    merge(planes, 2, complexI);         // Add to the expanded another plane with zeros
    dft(complexI, complexI);            // this way the result may fit in the source matrix
    // compute the magnitude and switch to logarithmic scale
    // => log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
    split(complexI, planes);                   // planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
    magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude
    Mat magI = planes[0];
    magI += Scalar::all(1);                    // switch to logarithmic scale
    log(magI, magI);
    // crop the spectrum, if it has an odd number of rows or columns
    magI = magI(Rect(0, 0, magI.cols & -2, magI.rows & -2));
    // rearrange the quadrants of Fourier image  so that the origin is at the image center
    int cx = magI.cols/2;
    int cy = magI.rows/2;
    Mat q0(magI, Rect(0, 0, cx, cy));   // Top-Left - Create a ROI per quadrant
    Mat q1(magI, Rect(cx, 0, cx, cy));  // Top-Right
    Mat q2(magI, Rect(0, cy, cx, cy));  // Bottom-Left
    Mat q3(magI, Rect(cx, cy, cx, cy)); // Bottom-Right
    Mat tmp;                           // swap quadrants (Top-Left with Bottom-Right)
    q0.copyTo(tmp);
    q3.copyTo(q0);
    tmp.copyTo(q3);
    q1.copyTo(tmp);                    // swap quadrant (Top-Right with Bottom-Left)
    q2.copyTo(q1);
    tmp.copyTo(q2);
    normalize(magI, magI, 0, 1, NORM_MINMAX); // Transform the matrix with float values into a
                                            // viewable image form (float between values 0 and 1).
    imshow("Input Image"       , I   );    // Show the result
    imshow("spectrum magnitude", magI);
    waitKey();
    return EXIT_SUCCESS;
}

观察一下，图像旋转后能谱图也会随着旋转。
Lena的能谱图如下：
在这里插入图片描述

qq_67259275

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
使用OpenCV实现离散傅里叶变换（DFT）

使用OpenCV实现离散傅里叶变换（DFT）傅里叶变换，妈呀这个东东好高级啊！真的高级吗？理解起来还真是有点困难，需要一些高等数学的基础。有了OpenCV，你不理解也没问题，会用就OK！就好比你会用手机打电话和聊天，至于你为什么拥有了孙悟空的千里眼和顺风耳的能力，这就不管了.以下内容原文来自opencv-4.2.0-docs/4.2.0/d8/d01/tutorial_discrete_fou...
复制链接

扫一扫