CUDA
文章平均质量分 92
酬勤-人间道
这个作者很懒,什么都没留下…
展开
-
CUDA-矩阵运算
这里对矩阵运算做个记录头文件头文件#include "cuda_runtime.h"#include "cublas_v2.h"辅助函数//两个模板函数#define fatalError(s) do { \ std::stringstream _where, _message; \ _where <.翻译 2020-11-13 22:11:24 · 893 阅读 · 0 评论 -
关于cuda和opencv混合编译之后的一些算法加速--求取灰度平均数值
今天就来说说关于使用opencv 使用cuda加速的版本吧,来做一点记录,免的以后忘记了下载opnecv4.10板本和contrib4.10版本,使用cmke编译,这里注意 opencv选项中,扩展的路劲,以及勾选 WITH_CUDA 这个选项,不然编译之后的DLL,没有cuda版本的,大约是这些个样子的,这里附上我编译之后的lib include 文件.的百度云链接,可以直接下载...原创 2019-06-26 20:59:50 · 639 阅读 · 0 评论 -
关于cuda和opencv混合编译之_高斯滤波
这里都是加速之后的一些使用方式,有一些细节上面的变化//高斯滤波gpu加速.这里介绍一下kerneltype 这个是高斯核的大小,一般为3*3 5*5 7*7 等.bool gaussianBlur_gpu(cv::Mat &src,cv::Mat &dst,int kernelType = 5){ if (src.data == nullptr) { ...原创 2019-06-26 21:12:48 · 1486 阅读 · 2 评论 -
关于cuda和opencv混合编译之_双边滤波
说起双边滤波,主要这个算法在cpu上太耗时了,平均下来,要100多毫秒.怎么办呢,不怕,加速..bool bilateralFilter_gpu(const cv::Mat& src,cv::Mat &dst){ if (src.data == nullptr) { return false; }//这里不介绍了,日常的上传下载. cv::cuda::...原创 2019-06-26 21:20:10 · 720 阅读 · 0 评论 -
关于cuda和opencv混合编译之_自定义算法加速模板,适用于大部分图像处理了
虽然opencv提供了不错的加速算法,但是我们很多自己的算法,没法很好的使用,所以,我们只能用cuda上的算法,但是这样又回到了cuda上面那一套东西来,这里,我们可以使用技巧一点的方式,就是搭载于gpuMat这个结构,来做处理.//这里只是做个引导,但是大部分的算法,都是按下面这个算法的变种而来,废话不多说,//注意,这个这个是在 cudaCalculate.h文件中的申明....原创 2019-06-26 22:01:09 · 623 阅读 · 0 评论 -
在cuda中,使用自定义结构体,
在使用GPU加速中,有时需要传入结构体来进行统一计算,完后再同意导出,所以,在参考了一些资料,做了一下测试, 并记录,以供以后继续看原创 2019-08-25 09:53:20 · 3818 阅读 · 0 评论 -
cuda中,两个维度的数组如何使用 也是看了别人的文章,完后自己也实现一下
cudaimprocess.h#define M 16#define N 16__global__ void build_TransMat(float* d_transMat,size_t pitch);void D2DimTest();cudaimprocess.cu__global__ void build_TransMat(float * d_transMat, size...转载 2019-08-25 10:08:44 · 322 阅读 · 0 评论 -
cuda中,类似于std::vector的容器,__device_vector 的使用方式
起因由于要将剔除最小连通域中 std:;vetor 这个数据容器,在 kernel 核函数也有类似的使用,所以,查阅资料等百度,完后就找到了 thrust:: 中的 __host_vector, 和 device_vector 这两个东西。然而发现,其依旧需要在本地代码段中来 提前扩展其大小,而不能在kernel 中使用…不过就当记录一下吧,为了以后可以直接拿来使用代码核函数__g...翻译 2019-09-27 10:22:49 · 4294 阅读 · 0 评论 -
opencv去除最小孔洞以及最小连通域的cuda加速,(这里只供自己查看)
描述最近遇到一个opencv中,去除最小空洞以及最小连通域的 算法, 因为要优化并集成到项目中,所以使用cuda对其进行加速,不过中间遇到一些问题,需要诚待解决,而且只是初版,里面的关于最佳线程数量的分配,都还没有优化。不过先贴上来吧,等有好的方式再做修改.opencv原算法.(这里其实也是百度到的一个)void Qimage2MatInteroperateGpu::removeSmallR...翻译 2019-09-27 10:42:42 · 1072 阅读 · 1 评论