CUDA
Sumujingling
这个作者很懒,什么都没留下…
展开
-
CUDA之矩阵乘法——globalmemory
根据CUDA讲座调试矩阵乘法报错错误 17 error : no instance of overloaded function “cudaMalloc” matches the argument list E:\Niki\MVDR_BTR\MVDR_BTR\MatrixMulOnDevice.cu 16 修正:把CUDAcudaMalloc(&Nd, size);改成cudaMa原创 2016-05-12 08:17:45 · 1151 阅读 · 0 评论 -
CUDA之矩阵乘法——TILE&sharedmemory
CUDA 矩阵乘法将输入数据分成很多个TILE使用shared memory进行并行计算原创 2016-05-25 10:12:02 · 3379 阅读 · 0 评论 -
CUDA之矩阵乘法——非方阵计算
说明A矩阵为M * N,B矩阵为N * M,求C = A * B;原创 2016-05-26 18:12:27 · 2276 阅读 · 0 评论 -
CUDA之矩阵转置
在波束形成中除了矩阵乘法,还需要一个矩阵转置。 其实用C语言来实现矩阵转置很简单,但是速度可能比较慢。参考博文:CUDA矩阵转置const int TILE_SIZE = 4; __global__ void TransposeKernel(const原创 2016-05-30 09:26:59 · 2486 阅读 · 0 评论 -
CUDA之学习资料
NYU Prof. Mohamed Zahran 的GPU 教学资料胡文美教授的CUDA讲座原创 2016-05-30 10:48:48 · 588 阅读 · 0 评论 -
CUDA之矩阵乘法——复数
做好矩阵乘法和转置之后本来开心得不行的! 准备上手做个最基本的波束形成了! 突然发现希尔伯特变换完以后需要进行各种复数的运算…所以临时补写了一个复数乘法… 学着学着好像有点感觉了~!还是蛮有意思的。当然前提是能调试成功。 用一句傅小姐的名言鼓励一下“只要心甘情愿任何事情都会变得简单!”。原创 2016-05-30 16:55:25 · 4255 阅读 · 1 评论 -
CUDA之窄带常规波束形成
思路现在手上有了cuda的复数矩阵乘法和复数矩阵转置。理论上讲可以做一个简单的波束形成了。 按照matlab之并行计算 的思想把for循环都变成矩阵来做。复数矩阵定义typedef struct { int width; int height; int stride; double * real; double * imag;} Matrix;复数矩原创 2016-05-31 22:31:27 · 2301 阅读 · 1 评论 -
使用 CUBLAS 库给矩阵运算提速
转自http://www.cnblogs.com/scut-fm/p/3756242.html前言 编写 CUDA 程序真心不是个简单的事儿,调试也不方便,很费时。那么有没有一些现成的 CUDA 库来调用呢? 答案是有的,如 CUBLAS 就是 CUDA 专门用来解决线性代数运算的库。 本文将大致介绍如何使用 CUBLAS 库,同时演示一个使用 CUBLAS 库进行矩阵乘法的例子。转载 2016-09-07 21:57:50 · 1373 阅读 · 0 评论