CUDA编程模型简介

最新推荐文章于 2024-08-23 23:22:28 发布

Ahuier21

最新推荐文章于 2024-08-23 23:22:28 发布

阅读量2.6k

点赞数 1

分类专栏： CUDA 文章标签： CUDA 编程模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yinhuier/article/details/82888474

版权

本文介绍了CUDA编程模型，包括其异步编程结构、内存层次（全局和共享内存）以及线程管理（线程块、线程网格）。CUDA程序通常涉及数据在CPU和GPU间的传输，核函数在GPU上执行，并通过线程块和线程网格进行并行处理，共享内存则提供了线程间协作的可能性。

摘要由CSDN通过智能技术生成

CUDA编程模型简介

CUDA编程模型

CUDA编程模型

本篇博客主要对CUDA的编程模型、内存层次结构、线程管理进行简单的介绍。

1、编程结构

CUDA是一种通用的并行计算平台和编程模型，是在C语言基础上扩展。
一些术语区分：


设备	GPU及其内存（设备内存）
主机	CPU及其内存（主机内存）

CUDA编程模型主要是异步的，因此在GPU上进行的运算可以与主机-设备通信重叠。一个典型的CUDA程序包括由并行代码互补的串行代码。如图所示，串行代码（及任务并行代码）在主机CPU上执行，而并行代码在GPU上执行。主机代码按照ANSI C标准进行编写，而设备代码使用CUDA 进行编写。你可以将所有的代码统一放在一个源文件中，也可以使用多个源文件来构建应用程序和库。
一个典型的CUDA程序实现流程遵循以下模式。

把数据从CPU内存拷贝到GPU内存。
调用核函数对存储在GPU内存中的数据进行操作。
将数据从GPU内存传送到CPU内存。

图表 1 一个典型的CUDA程序

2 内存层次结构成

CUDA编程模型从GPU架构中抽象出一个内存层次结构。如下图所示的是一个简化的GPU内存结构，它主要包含两部分：全局内

最低0.47元/天解锁文章

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Ahuier21 CSDN认证博客专家 CSDN认证企业博客

码龄10年

21: 原创

15万+: 周排名

91万+: 总排名

5万+: 访问

: 等级

571: 积分

4: 粉丝

14: 获赞

7: 评论

62: 收藏

私信

关注

热门文章

分类专栏

linux 命令 1篇
进程 1篇
线程 1篇
编译器 4篇
python 1篇
Linux 9篇
nvprof 1篇
CUDA 3篇
环境搭建 1篇
浏览器配置
工具使用 4篇
leetcode 2篇
tensorflow 1篇
TVM 3篇
C++ 6篇

最新评论

Linux下安装TVM
泡椒香菜‍: do not have cmake
使用pdb与gdb调试TVM源码
RGQTJU: 为何attach线程编号以后，下面又出现额外的线程编号[New LWP 32198] [New LWP 32199]，这还只是在python代码中，并没有进入Openmp部分，设置了函数断点以后程序停不下来，我们已经在编译的时候在CMAKE中设置了Debug模式SET(CMAKE_BUILD_TYPE "Debug")
使用pdb与gdb调试TVM源码
qq_36407386: 大佬您好，$ echo "0" | sudo tee /proc/sys/kernel/yama/ptrace_scope 这个命令找不到怎么办
nvprof工具使用及结果分析，持续更新。。。
錢予: 请问API calls的时间中，cudaLaunch函数的时间包括核函数的执行时间吗？
Linux下安装TVM
人间真正走过~: 您好想请问在cd build之后直接cmake会报command not found

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。