GPU — CUDA 编程模型

范桂飓

已于 2022-04-05 13:17:31 修改

阅读量4k

点赞数 2

分类专栏：软硬件融合加速技术专栏文章标签： GPU

于 2022-04-02 22:45:46 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Jmilk/article/details/123930701

版权

软硬件融合加速技术专栏专栏收录该内容

226 篇文章 153 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了GPU从图形处理器演变为GPGPU的过程，详细讲解了CUDA编程模型，包括CUDA架构、工作原理，以及Grid、Block、Thread和Warp的概念。CUDA作为NVIDIA的编程接口，使得开发者能利用GPU进行高效并行计算，适用于AI训练、视频编码加速等场景。

摘要由CSDN通过智能技术生成

目录

文章目录

目录
GPGPU
CUDA 编程模型
CUDA 的架构
CUDA 的工作原理
- Grid、Block、Thread
- Warp

GPGPU

GPU 起初是用来处理图像的，但是后来人们发现其并行运算原理不仅可以用在图形渲染上，也可以推广到一般的运算中。于是 GPU 的功能就进行了升级，可以进行稍微复杂的工作了，并且可编程，也就有了 GPGPU（通用图形处理器）的概念。

GPGPU 其实是对 GPU 的一种优化，让 GPU 更加的具有易用性和通用型，GPU 应用于 ML/AI 就是 GPU 通用属性的一个方向，类似的方向有很多：挖矿、HPC 高性能计算等。

GPU 可以利用多个 CUDA Core / SP 来做并行计算，而 CPU 只能按照顺序进行串行计算，同样运行 3000 次的简单运算，CPU 需要 3000 个时钟周期，而配有 3000 个 CUDA 核心的 GPU 运行只需要 1 个时钟周期。

如果想用 GPU 做通用的计算，就要有更通用的编程工具。为此，很多针对 GPGPU 的并行计算架构就产生了，主要有 CUDA 和 OpenCL。

在这里插入图片描述

CUDA 编程模型<

了解本专栏

超级会员免费看

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

范桂飓 文章对您有帮助就请一键三连：）

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。