如何使用
包含头文件
#include <opencv2/gpu.hpp>
链接库添加cudaopencv库
使用来说需要使用cv::cuda::GpuMat,它是在gpu上的数据结构。
一个upload,一个download
Mat I1;
cuda::GpuMat gI;
gI.upload(I1);
//download
I1 = gI; //or gI.download(I1)
使用cuda的函数需要使用GpuMat;另外,需要注意的一点是,GPU输入的数据要么是1通道的要么是四通道的,每一个元素是char或者float类型的,GPU不支持double类型的。如果传给其它类型,会报异常。这样一来,如果要处理三通道的图像,有两种方法:一是添加一个新通过,或者split图像到三个通道,然后分别处理。
如何优化
- GPU的内存分配太费时,所以尽量不要在函数里面分配内存,在函数外分配内存然后传引用进去。
- 避免不必要的数据传输,尽量使用提供的函数。例如:b.t1 = 2 * b.mu1_mu2 + C1;用下面的函数代替。
gpu::multiply(b.mu1_mu2, 2, b.t1); //b.t1 = 2 * b.mu1_mu2 + C1;
gpu::add(b.t1, C1, b.t1);
3.使用异步调用方式。
gpu::Stream stream;
stream.enqueueConvert(b.gI1, b.t1, CV_32F); // Upload
gpu::split(b.t1, b.vI1, stream); // Methods (pass the stream as final parameter).
gpu::multiply(b.vI1[i], b.vI1[i], b.I1_2, stream); // I1^2