Cuda
文章平均质量分 59
沤江一流
我的所见所闻,讲给你听。
展开
-
(Cuda)流Stream(三)
本文地址:1.流(stream)的理解一个流对应并发的概念,是一组顺序执行的操作(可能由多个主机线程发出); 多个流对应并行的概念,因为发生顺序具有不确定性。2.相关函数//基本函数 cudaStream_t stream//定义流 cudaStreamCreate(cudaStream_t * s)//创建流 cudaStreamDestroy(cudaStream_t s)//销毁流原创 2016-04-08 01:08:03 · 14175 阅读 · 1 评论 -
(Cuda)存储器Memory(二)
本文地址1 Device Memory这是对后边的shared memory, global memory等的总称可分为linear memory和 CUDA arraysCUDA arrays为纹理获取做了优化,见纹理存储器对于线性存储器,一般用以下函数处理: 函数 描述 cudaMalloc() cudaMemcpy() cudaMallocPitch()原创 2016-05-02 01:16:18 · 3623 阅读 · 0 评论 -
(Cuda)基础知识(一)
本文地址http://blog.csdn.net/mounty_fsc/article/details/51092920本部分内容为[1]CUDA_C_Programming_Guide.pdf中笔记1 限定符1.1 函数限定符 限定符 执行 调用 __device__ device device __global__ device host(计算能力3.x可de原创 2016-05-02 00:11:27 · 7152 阅读 · 0 评论 -
(Caffe)编程小技巧
Cuda中要处理单位数据N大于可用的线程数量N’时以向量乘函数为例,mul_kernel(n,a,b,y)对长为n的a,b求内积,结果放入ytemplate <typename Dtype>__global__ void mul_kernel(const int n, const Dtype* a, const Dtype* b, Dtype* y) { CUDA_KERNEL_LOO原创 2016-05-02 13:36:47 · 5277 阅读 · 0 评论