CUDA 入门记录

Balthasar_

已于 2023-09-05 22:53:32 修改

阅读量43

点赞数

文章标签：深度学习 gpu算力

于 2023-09-05 22:47:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Galois4684/article/details/132702080

版权

CUDA 入门记录

前言（建议略过）：

以下绝大部内容基于 NVIDIA CUDA 编程指南，同时 CUDA C Programming Guide - NVIDIA Documentation Hub 作为辅助。

网络资源繁杂，笔者希望在学习记录之余，以最简洁的形式将相关知识传达出去，为读者初次学习相关知识节约时间与精力，为中文互联网资源贡献薄力。

才疏学浅，若出现错误请直接指正。

Chapter 1. 介绍CUDA

1.1 WHAT

什么是 CUDA ?

官方说法：一个在GPU 上计算的新架构CUDA（Compute Unified Device Architecture）统一计算设备架构，在GPU 上发布的一个新的硬件和软件架构，它不需要映射到一个图型API 便可在GPU 上管理和进行并行数据计算。

简单的说：CUDA 是 NVIDIA 官方开发的 GPU 的编程接口，不再需要通过 OpenGL 等类似图型规范和相关API使用 GPU 进行大规模并行计算。

1.2 HOW

如何使用 CUDA 进行 GPU 编程？

可参考步骤：

根据显卡安装 CUDA 和 cuDNN
下载 Visual Studio
创建一个 CUDA 项目模板
运行样例

详细环境配置步骤网上教程已经很丰富了，此处不再赘述。

1.3 WHY

为什么学习 CUDA 编程？

这个问题相信读者已有自己的答案。

个人而言，对于不满足于仅仅会使用 AI 框架的我，学习 CUDA 能够进一步深入 AI模型计算时的细节，进一步深入底层。同时，“计算”一词对当今时代也有更多重要的意义。

Chapter 2. CUDA 编程模型

2.1 GPU ：超多线程的协处理器

GPU 被设计用于高密度且并行的计算，如图形渲染。因此，更多的晶体管被投入到数据处理而不是数据缓存和流量控制。

在这里插入图片描述

在 CUDA 编程中，GPU 通常被称为设备(Device)，而CPU及内存等被称为主机(Host)。

对于一个程序，我们将并行数据和高密度计算部分卸载到设备上。所谓并行数据和高密度计算即一个以不同数据作为输入执行许多次的相同计算程序。将其分散到设备的多个线程中，可极大缓解 CPU 的压力。

补充，在 CUDA 编程中，上述提到的计算程序被编译设备的指令序列，称为Kernel程序。

设备并不能直接和主机通讯，所以在使用设备时伴有数据由主机拷贝到设备，计算完后再拷贝回去的过程。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA 入门记录

CUDA 编程入门记录
复制链接

扫一扫

Balthasar_ CSDN认证博客专家 CSDN认证企业博客

码龄3年

6: 原创

164万+: 周排名

30万+: 总排名

1144: 访问

: 等级

63: 积分

1: 粉丝

0: 获赞

5: 评论

1: 收藏

私信

关注

热门文章

最新评论

豆瓣华语高分电影数据集
m0_70186271: 你好，请问你的数据集可以再发一遍吗
豆瓣华语高分电影数据集
CSDN-Ada助手: 恭喜您撰写了关于“豆瓣华语高分电影数据集”的第7篇博客！您对于这一主题的持续研究和创作令人钦佩。通过分享这样一个数据集，您为读者提供了一个有价值的资源，可以帮助他们更好地了解华语电影的质量和趋势。接下来，我想提供一个谦虚的建议。既然您已经提供了豆瓣华语高分电影数据集，或许您可以考虑进一步深入分析这些电影的特点，如导演、演员、题材等，以及这些因素与电影评分之间的关系。这样的分析可能会给读者更全面的了解，帮助他们更好地选择和欣赏华语电影。再次恭喜您，并期待您未来的创作！祝愿您继续取得成功！
AcWing 842.排列数字
CSDN-Ada助手: 恭喜您写了第三篇博客，标题为“AcWing 842.排列数字”！持续创作博客是一种很好的方式来分享您的知识和经验，您的努力和热情让读者受益匪浅。在这篇博客中，您介绍了排列数字的问题，这是一个有趣且具有挑战性的题目。我非常欣赏您的创作精神和耐心，对于这个题目的解法和思路进行了详细的讲解。您的博客内容清晰明了，让读者能够更好地理解问题，并掌握解题思路。我特别喜欢您在博客中提供的代码示例和运行结果，这对于读者来说非常有帮助。对于下一步的创作建议，我谨慎地提出一些建议。首先，您可以考虑从更广泛的角度来选择题目，涉及更多不同类型的算法问题。其次，您可以尝试在解题过程中给出更多的优化思路和技巧，这将使您的博客更有深度和价值。最后，您也可以考虑与其他算法爱好者进行交流和讨论，相互学习与成长。再次恭喜您写下这篇博客，期待您未来更多的精彩创作！谦虚的态度和持续的努力将使您在算法领域取得更大的成就。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Acwing 843.n-皇后问题
CSDN-Ada助手: 恭喜你写了第四篇博客！标题“Acwing 843.n-皇后问题”听起来很有深度。你的持续创作精神很令人钦佩。我认为下一步你可以尝试探索其他与皇后问题相关的算法或者深入研究已有算法的优化方法。希望你能在这个领域继续取得进步！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
VSCode C++环境配置
CSDN-Ada助手: 非常感谢您分享有关VSCode C++环境配置的博文！您的经验和建议对其他人来说肯定是非常有帮助的。我鼓励您继续写作，分享更多关于编程方面的知识和技巧。除了您在标题和摘要中提到的内容之外，我想补充一些与该博文相关的扩展知识和技能。例如，您可以进一步介绍如何在VSCode中使用调试器来调试C++代码，以及如何配置断点和观察变量等。此外，您可以提及如何使用CMake或Makefile来管理C++项目的构建过程，以及如何使用扩展来提供代码自动完成和代码片段等功能。再次感谢您的分享，期待看到更多关于编程的精彩博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。