GPU编程
真的很拉风
这个作者很懒,什么都没留下…
展开
-
[GPU]2.编译.cu文件
如果你完成了这些的话,编译.cu文件就比较容易了,比如这个文件,我命名为hello_world.cu。在编译.cu文件的时候,需要先确定自己已经安装了CUDA,并将其配置到系统环境中。当然这个的前提是——你的显卡得是nvida的,你才能安装这个工具。如果编译成功,你可以发现文件夹中出现hello_world。指令执行编译后的文件。原创 2024-03-13 10:46:31 · 325 阅读 · 0 评论 -
[GPU]1.并行执行的思路——内核函数
总共的线程数即NUM_BLOCKS*BLOCK_WIDTH,注意BLOCK_WIDTH存在最大值,根据设备的不同,有512和1024两种取值(可能之后会有更高的?不同于串行计算的函数内循环执行,并行计算使用的是内核函数,每个线程执行单个内核函数,来达到多次执行的效果。当然,调用该函数的方式也有所不同。关键字,该关键字指定函数为核函数,并交由GPU并行执行。相信我们都熟悉了如何调用一个串行执行的程序。CUDA编程使用的是类似于C语言的语法。原创 2024-03-13 10:35:41 · 144 阅读 · 0 评论