GPU并行计算
文章平均质量分 74
FILWY_M
一只正在慢慢成长的小菜鸡.......
展开
-
VS2017+CUDA开发环境的配置
GPU开发环境配置一、VS2017安装下载VS下载链接:需要登陆微软账号,没有注册一个即可安装VS安装组件选择,只需要选择最基本的C/C++开发即可(.NET桌面开发可以不用) 安装位置更改 点击安装即可 安装完成后打开界面如下 创建一个C++程序进行测试 点击确定,等待项目创建,项目会自动创建一个cpp文件,测试代码如下:#include <iostream>int main(){ std::cout << ".原创 2021-12-11 17:27:58 · 4899 阅读 · 1 评论 -
cuda中threadIdx、blockIdx、blockDim和gridDim的使用
一、直观的感觉线程、线程块、线程格为了直观的感觉线程、线程块、线程格,画了下面一个示意图。分为了两部分,一部分为线程格,另一部分为线程块,在图中线程格和线程块都画成了3维的,实际也可以是一维或者二维的。其中线程格里面最小的单元为线程块,而一个线程块里面最小的单元为线程。二、threadIdx、blockIdx、blockDim和gridDim可以把线程格和线程块都看作一个三维的矩阵。这里假设线程格是一个3*4*5的三维矩阵, 线程块是一个4*5*6的三维矩阵。gridDimgridDim.x原创 2021-12-08 16:15:32 · 15024 阅读 · 1 评论 -
如何理解Cuda中的cudaMalloc函数的第一个参数是两个星星?
如何理解Cuda中的cudaMalloc函数的第一个参数是两个星星?了解这个问题首先要理解指针,可以参考这两个博客,这两个博客对于指针的简介很直观。指针游戏1 最简单的指针游戏_Dezeming的博客-CSDN博客_游戏指针指针游戏2 传递地址的指针_Dezeming的博客-CSDN博客_指针游戏2int *dev_c;cudaMalloc()的第一个参数是一个指针,指向用于保存新分配内存地址的变量。也就是cudaMalloc分配了一块内存,这块内存的位置假设为add,我们想让dev_c获取这个原创 2021-12-07 22:16:27 · 2584 阅读 · 0 评论