CUDA
随风秀舞
这个作者很懒,什么都没留下…
展开
-
【cuda】blockDim的大小是如何确定的?
待解决。 函数调用如下: dim3 dimBlock(THREADSIZE); dim3 dimGrid((m+dimBlock.x-1)/dimBlock.x); mv_kernel>> 在mv_kernel函数中,使用int row = blockIdx.x * blockDim.x + threadIdx.x;和使用int row = blockIdx.x + threadIdx.原创 2013-05-25 11:12:17 · 5943 阅读 · 5 评论 -
cublasSgemm处理C中按行存储的矩阵乘法
由于cublas为了更大的适应Fortan语言,二维数据的存储采用以列优先的方式,这与C/C++中,行优先的存储方式不同。由于本人的研究是数据的来源是C代码得到的,为了加速矩阵的运算效率,利用cublas来完成。本文档提出了一种有效的解决方案。 为了更好的说明,以函数cublasSgemm的实现C= A*B为例。接口cublasSgemm 实现的功能为C = alpha*A*B + be转载 2013-11-02 14:22:06 · 3090 阅读 · 0 评论 -
cublasStrsv中的下/上三角矩阵必须是按列存储的
cublasStrsv中的下/上三角矩阵必须是按列存储的 尝试过将status = cublasStrsv(handle, CUBLAS_FILL_MODE_LOWER, CUBLAS_OP_T, CUBLAS_DIAG_NON_UNIT, 3, d_a, 3, d_b, 1); 中的CUBLAS_OP_T改成CUBLAS_OP_N,都是不行的。。。原创 2013-11-04 12:49:28 · 1998 阅读 · 0 评论 -
VS2010中配置CUDA5.0
1、安装之前必须确认自己电脑的GPU支持CUDA。在设备管理器中找到显示适配器(Display adapters),找到自己电脑的显卡型号,如果包含在http://www.nvidia.com/object/cuda_gpus.html的列表中,说明支持CUDA。 安装CUDA之前最好检查一下自己电脑的显卡驱动版本,版本过老的话,需要更新。有时候安装完毕CUDA之后,运行6中的deviceQue原创 2012-12-31 10:03:27 · 36686 阅读 · 105 评论