cuda中循环展开和并行归约的代码理解及可视化辅助理解

PartyAnimal_w

已于 2023-12-20 12:48:36 修改

阅读量646

点赞数 11

文章标签： c++ gpu算力

于 2023-12-19 17:31:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/partyanimalw/article/details/135089500

版权

参考

首先列出参考文献：

代码部分：会了么的个人空间-会了么个人主页-哔哩哔哩视频 (bilibili.com)

图片及部分理解部分：Cuda C编程权威指南1.并行规约分化+循环展开-CSDN博客

背景

cuda的执行模型

逻辑概念上，grid>block>thread

也就是，网格>线程块>线程

每个核函数的启动都对应着一个grid，grid中的所有block共享全局内存，每个block又是由许多线程构成的（block内的线程共享共享内存）。

CUDA中SIMD的基本单位是一个warp（线程束一般是由32个线程组成，共享寄存器）。

threadIdx.x：当前线程在线程块中的索引

blockIdx.x：当前线程块的索引

blockDim.x：每个block的线程数

一般在main函数中用下面代码定义：

    // initialization
    int size = 1 << 24; // total number of elements to reduce
    printf("    with array size %d  ", size);

    // execution configuration
    int blocksize = 1024;   // initial block sizeif(argc > 1)
    {
        blocksize = atoi(argv[1]);   // block size from command line argument
    }

    dim3 block (blocksize, 1);
    dim3 grid  ((size + block.x - 1) / block.x, 1);
    printf("grid %d block %d\n", grid.x, block.x);

以上代码每个block的thread数初始值是1024，但是可以在终端设置大于1的数。

此外，

tid：当前thread在这个block中的id索引

最低0.47元/天解锁文章

PartyAnimal_w CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

146万+: 周排名

11万+: 总排名

5339: 访问

: 等级

163: 积分

61: 粉丝

86: 获赞

5: 评论

97: 收藏

私信

关注

热门文章

最新评论

【更新】Nsight System相关（旧：nvvp打开时遇到的问题及解决）
CSDN-Ada助手: 恭喜作者持续更新博客内容，分享关于Nsight System相关的知识和经验。建议在下一篇博客中，可以分享更多关于nvvp打开时遇到的问题及解决的经验，或者可以探讨一些其他与Nsight System相关的话题，让读者能够获益更多。希望作者能够继续保持创作的热情，为大家带来更多有价值的内容。
cuda学习之使用常量内存实现一维模板
CSDN-Ada助手: 恭喜作者在cuda学习中取得了进展，使用常量内存实现一维模板的经验分享对于初学者来说非常有帮助。希望作者能继续坚持创作，可以考虑分享一些实际应用中的案例分析或者深入研究某个特定的cuda技术点，这样可以让读者更深入地了解cuda编程。期待作者的下一篇博客！
cuda中循环展开和并行归约的代码理解及可视化辅助理解
CSDN-Ada助手: 非常感谢您分享关于cuda中循环展开和并行归约的代码理解及可视化辅助理解的博客！您的文章对于理解这些概念非常有帮助，尤其是通过可视化辅助理解，更加直观清晰。祝贺您持续创作，希望您能继续分享更多关于cuda编程以及并行计算方面的知识，让更多的人受益。同时，建议您在下一篇博客中可以适当引用一些相关的理论或者案例，以加深读者对于这些概念的理解。期待您更多的精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Qt和Geant4的安装相关问题
CSDN-Ada助手: 恭喜你开始了博客创作！Qt和Geant4的安装相关问题是一个很有价值的话题。接下来，我建议你可以分享一些自己的安装经验和技巧，或者结合实际案例，详细介绍一下解决安装问题的方法。希望你能继续坚持写下去，分享更多有价值的内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Qt和Geant4的安装相关问题
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/617691653。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。