cuda
bleedingfight
用最少的资源搬最多的砖!
展开
-
CMAKE实现CUDA代码编写
环境说明CUDA:cuda-11driver:460.67os:5.10.18-1-MANJAROCMAKE:3.19.5目录结构如下:├── CMakeLists.txt├── include│ └── sumMatrix.h├── main.cu└── src ├── CMakeLists.txt └── sumMatrix.cu2 directories, 5 filescuda函数这里为了简便,CUDA实现的是一个二维矩阵加法,头文件(inclu原创 2021-04-16 11:18:59 · 3432 阅读 · 1 评论 -
cuda学习(1)
cuda并行计算流程Created with Raphaël 2.1.2CPU memoryCPU memoryGPU memoryGPU memory需要算点东西,数据发送给你执行代码。算好的结果给你CPU上运行代码的例子:#include<iostream>#include<math.h>//定义函数add对两个浮点数据求和void add(int...原创 2018-03-27 11:17:46 · 358 阅读 · 0 评论 -
cuda(2(c))
cuda代码实现步骤声明分配host和device memory初始化host数据从host到device转移数据执行一个或者更多核心转移device结果到host常用的cuda函数cudaMalloc(&device_var,sizeofarray):通常device_var表示gpu上为数组开辟的空间,sizeofarray:数组占据的bit位数。host...原创 2018-03-27 22:21:49 · 195 阅读 · 0 评论 -
cuda
常见变量gridDim.x:grid中包含的线程块的索引(上图包含4096个线程块)blockIdx.x:grid中包含当前线程块的索引(上图每个线程块的索引从0-255)blockDim.x:线程块中线程数量(上图线程块中的线程数为256)threadIdx.x:线程块中的线程的索引(上图的中橙色3的线程索引为3)线程索引:index = blockIdx.x * bl...原创 2018-05-26 13:51:05 · 192 阅读 · 0 评论