cuda 关于线性并行

最新推荐文章于 2023-03-20 20:31:34 发布

海啸tsunami

最新推荐文章于 2023-03-20 20:31:34 发布

阅读量663

点赞数

分类专栏： cuda

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lzyyh2012/article/details/16828161

版权

cuda 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

在之前的几个程序里面， addWithCuda(int *c, const int *a, const int *b, unsigned int size);它在检查完设备正常与否，分配gpu缓存空间，传递数据之后有这么一个调用：addKernel<<<1, size>>>(dev_c, dev_a, dev_b);

启动核函数的调用过程，这里看到调用方式和C不太一样。<<<>>>表示运行时配置符号，里面1表示只分配一个线程组（又称线程块、Block），size表示每个线程组有size个线程（Thread）。本程序中size根据前面传递参数个数应该为5，所以运行的时候，核函数在5个GPU线程单元上分别运行了一次，总共运行了5次。这5个线程是如何知道自己“身份”的？是靠threadIdx这个内置变量，它是个dim3类型变量，接受<<<>>>中第二个参数，它包含x,y,z 3维坐标，而我们传入的参数只有一维，所以只有x值是有效的。通过核函数中int i = threadIdx.x;这一句，每个线程可以获得自身的id号，从而找到自己的任务去执行。

我是初学者参考很多文档啊，博客啊，书籍啊，Augusdi的博客特别好，对我帮助很大。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。