当我们使用显卡调用cuFFT库计算FFT后(FFT计算,请参考https://blog.csdn.net/endlch/article/details/46724811),需要对cufftComplex*类型的数据进行进一步处理,比如取模,两个复数相乘等操作,恰巧,库里面也配套了cuComplex.h,其中包含复数基本操作函数,主机和设备端均可调用。我目前还没找到针对复数数组取模的现成并行函数,就写了个简单的核函数。以下是代码。
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <iostream>
#include <stdio.h>
#include <cufft.h>
#include <cufftXt.h>
#include <math.h>
using namespace std;
__global__ void abs_complex(cufftComplex* pSrc, float* pDst)
{
int tx = threadIdx.x;
pDst[tx] = cuCabsf(pSrc[tx]);
}
int main()
{
cufftComplex* hSrc = (cufftComplex*)malloc(sizeof(cufftComplex) * 10);
float* hDst = (float*)malloc(sizeof(float) * 10);
cufftComplex* pSrc;
float* pDst;
cudaMalloc((void **)(&pSrc), sizeof(cufftComplex)