CUDA（Compute Unified Device Architecture）

Richard.M

已于 2023-08-16 23:28:07 修改

阅读量85

点赞数

文章标签：学习

于 2023-05-10 20:00:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46825856/article/details/130607300

版权

A Performance Model for GPU Architectures that Considers On-chip Resources:Application to Medical Image Registration-Junhao wu

1.CUDA（Compute Unified Device Architecture），是NVIDIA推出的运算平台。是一种通用并行计算架构，该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构（ISA）以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA™架构编写程序，所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。

2.GPU中有多个SM(Streaming Multiprocessor串流多处理器)，SM中有多个SP(Streaming Processor流处理器)，一个SM会负责多个ThreadBlock(线程块)的计算任务，一般为8个。每个SP一个时刻负责一个thread；

硬件层面，SM中有shared memory, register, L1 cache，因此ThreadBlock内可以共享shared memory，单独的thread拥有自己的Local memory(先被分配到register中，如果register不够就分配到global memory中)；

Warp是SM调度和执行的基本单位。SIMT机制使得同一个Warp里的线程根据不同的DATA执行相同的指令。一个SM，一次只能运算一个Block里的一组Warp，如果warp中有线程的DATA没有取到，那么调度下一下warp运算。
Half-Warp是SM存储操作的基本单位。它和coalescing访问global memory息息相关。

3.

thread：一个CUDA的并行程序会被以许多个threads来执行。
block：数个threads会被群组成一个block，同一个block中的threads可以同步，也可以通过shared memory通信。
grid：多个blocks则会再构成grid。

4.理解CUDA中的thread,block,grid和warp - 知乎

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA（Compute Unified Device Architecture）

CUDA
复制链接

扫一扫

Richard.M CSDN认证博客专家 CSDN认证企业博客

码龄4年

3: 原创

99万+: 周排名

65万+: 总排名

887: 访问

: 等级

31: 积分

0: 粉丝

1: 获赞

0: 评论

2: 收藏

私信

关注

热门文章

最新评论

Pytorch基础-adnarry中支持的广播运算
CSDN-Ada助手: 非常棒的博客！很高兴看到你继续分享关于Pytorch基础的知识。你对广播运算的解释非常清晰，比喻成分数的通分更是恰如其分。通过广播，我们可以将不同维度的数组进行统一，这对于处理不同形状的数据非常有用。除了广播运算，还有一些与Pytorch相关的扩展知识和技能可以继续探索。例如，你可以了解一下Pytorch中的自动求导机制，它可以自动计算梯度，方便我们进行反向传播和优化算法的实现。另外，Pytorch还提供了各种用于构建神经网络的模块和函数，你可以深入研究一下如何使用这些工具来构建和训练自己的模型。希望你能继续保持创作，分享更多有关Pytorch的知识和经验。谢谢你的努力！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
CUDA（Compute Unified Device Architecture）
CSDN-Ada助手: 恭喜你开始了博客创作，这篇《无标题》看起来就像是你踏出的第一步。期待看到你更多精彩的创作！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。