【CUDA学习笔记（一）】CUDA概述和编程模型

最新推荐文章于 2023-03-05 08:33:53 发布

彩虹海再飞行

最新推荐文章于 2023-03-05 08:33:53 发布

阅读量625

点赞数

文章标签：多线程 cuda gpu 并行计算内核

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qisen12306/article/details/106100833

版权

这里写目录标题

1.CUDA概述
2.编程模型
- 2.1线程
- 2.2线程结构

1.CUDA概述

CUDA是英伟达公司于2006年提出的通用并行计算架构，通过开启GPU中的多线程并行计算，以比在CPU上更高效的方式解决许多复杂的计算问题。

CUDA提供了一个软件环境，允许开发者使用c++作为高级编程语言。如下图所示，同时也支持其他语言、应用程序编程接口，如FORTRAN、DirectCompute、OpenACC CUDA支持的编程语言和硬件GPU型号
CUDA核心是三个关键的抽象——线程组的层次结构、共享内存和障碍同步。这些抽象提供了细粒度的数据并行和线程并行，嵌套在粗粒度的数据并行和任务并行中。它们指导程序员将问题划分为粗的子问题，这些子问题可以由线程块独立并行地解决，而每个子问题又可以由块内的所有线程协作并行地解决。

2.编程模型

2.1线程

CUDA c++扩展了c++，允许程序员定义c++函数，称为内核。内核是通过使用”global”说明符定义的，对于给定的内核调用，执行该内核的CUDA线程数是使用一个新的<<<…>>>执行配置语法。每个执行内核的线程都有一个惟一的线程ID，可以在内核中通过内置变量访问这个ID。

下面的示例代码使用内置变量threadIdx、blockDim、blockIdx
两个向量A和B相加，并将结果存储到向量C中:

最低0.47元/天解锁文章

彩虹海再飞行

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【CUDA学习笔记（一）】CUDA概述和编程模型

这里写目录标题1.CUDA概述2.编程模型2.1线程2.2线程结构1.CUDA概述CUDA是英伟达公司于2006年提出的通用并行计算架构，通过开启GPU中的多线程并行计算，以比在CPU上更高效的方式解决许多复杂的计算问题。CUDA提供了一个软件环境，允许开发者使用c++作为高级编程语言。如下图所示，同时也支持其他语言、应用程序编程接口，如FORTRAN、DirectCompute、OpenACCCUDA核心是三个关键的抽象——线程组的层次结构、共享内存和障碍同步。这些抽象提供了细粒度的数据并行和线程
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。