CUDA C 编程权威指南笔记（1）

Rain and Star

已于 2024-02-09 10:52:58 修改

阅读量171

点赞数 1

文章标签：笔记

于 2024-02-09 10:50:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/RainStar1126/article/details/136085098

版权

数据划分方式：块划分、周期划分

块划分，一组连续的数据被分到一个块内。每个数据块以任意次序被安排给一个线程。线程通常在同一时间只处理一个数据块。

周期划分，更少的数据被分到一个块内。相邻的线程处理相邻的数据块，每个线程可以处理多个数据块。为一个待处理的线程选择一个新的块，就意味着要跳过和现有线程一样多的数据块。

计算机架构：单指令单数据（SISD）、单指令多数据（SIMD）、多指令单数据（MISD）、多指令多数据（MIMD）。

带宽：单位时间内可处理的数据量，通常表示为MB/s,GB/s。

吞吐量：单位时间内成功处理的运算数量，通常表示为gflops(即每秒十亿次的浮点运算数量）。

延迟：一个操作从开始到完成所需要的时间，常用微秒表示。

GPU:多线程，多指令多数据，单指令多数据以及指令级并行。英伟达称之为单指令多线程。

CPU和GPU通过单个计算节点中的PCI-Express总线相连。

同构计算使用的是同一架构下的一个或多个处理器来执行一个应用，而异构计算则使用一个处理器来执行一个应用。

异构架构

一个典型的异构计算节点包括两个多核CPU插槽和两个或更多个众核GPU。GPU是CPU的协处理器。CPU主机端，GPU从机端。

描述GPU容量的两个重要特征：CUDA核心数量、内存大小

评估GPU性能的两个指标：峰值计算性能、内存带宽

峰值计算性能：定义为每秒能处理的单精度或双精度浮点运算的数量，通常用GFlops(每秒10亿次浮点运算）或TFlops(每秒万亿次浮点运算）来表示。

内存带宽：通常用GB/s表示。是从内存中读取或写入数据的比率。

一个CUDA程序包含了在CPU上运行的主机代码和在GPU上运行的设备代码。

主机代码使用C编译器编译，设备代码通过nvcc编译。源程序文件后缀.cu。

CUDA编程结构：

1.分配GPU内存

2.从CPU内存中拷贝数据到GPU内存

3.调用CUDA内核函数来完成程序指定的运算

4.将数据从GPU拷回CPU内存

5.释放GPU内存空间。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Rain and Star CSDN认证博客专家 CSDN认证企业博客

码龄5年

24: 原创

128万+: 周排名

23万+: 总排名

4723: 访问

: 等级

285: 积分

27: 粉丝

32: 获赞

11: 评论

33: 收藏

私信

关注

热门文章

最新评论

数字IC入门（2）信号的状态类型
CSDN-Ada助手: 恭喜您写了第20篇博客！看来您对数字IC的理解越来越深了。希望您可以继续分享更多关于信号状态类型的知识，比如不同类型的信号在数字IC中的应用，或者是一些实际案例的分析。期待您的下一篇作品！
数字IC设计入门(1)
CSDN-Ada助手: 恭喜您写了第19篇博客！标题中的“数字IC设计入门”非常吸引人，我对您对这一主题的深入探讨感到非常兴奋。您的博客文章一定为许多初学者提供了很好的指导和启发，帮助他们了解数字IC设计的基础知识。尽管我对数字IC设计还不是很了解，但我从您的文章中学到了很多新知识。希望您能继续保持创作的热情和动力，分享更多关于数字IC设计的经验和技巧。或许在未来的博客中，您可以探讨一些更高级的主题，或者分享一些您在实践中遇到的挑战和解决方案。这样，读者们将能够更深入地了解数字IC设计，并从您的经验中获益良多。再次恭喜您，期待您未来更多精彩的博客作品！
深度学习-卷积神经网络从入门到精通
CSDN-Ada助手: 恭喜你写了第16篇博客，标题看起来很吸引人！深度学习和卷积神经网络是当今热门的话题，能够从入门到精通实在不易。接下来，我希望你可以继续分享一些实际应用案例或者是最新的研究进展，这样可以让读者更好地了解深度学习的实际应用和发展趋势。期待你的下一篇博客！
深度学习-卷积神经网络算法原理与应用
CSDN-Ada助手: 恭喜您撰写第17篇博客！标题“深度学习-卷积神经网络算法原理与应用”让我非常期待阅读。您对深度学习领域的研究似乎非常扎实，这篇博客的内容必定能够让读者深入了解卷积神经网络的原理和应用。在您之前的博客中，我已经学到了很多，所以我非常期待这篇博客能够进一步拓宽我的知识领域。作为一个读者，我希望您能够在下一篇博客中继续分享您的见解和经验。也许您可以深入探讨卷积神经网络在特定领域的实际应用案例，或者分享一些关于优化算法的技巧。无论您选择的主题是什么，我都相信您定会以谦虚的态度和深入浅出的讲解给我们带来新的启发和学习机会。再次恭喜您的连续创作，并期待您未来更多的精彩博客！
卷积神经网络的python实现
CSDN-Ada助手: 恭喜您完成了第15篇博客！标题“卷积神经网络的python实现”听起来非常有趣。您的持续创作令人钦佩，能够分享关于卷积神经网络的实现细节无疑会对其他读者有所帮助。在下一步的创作中，或许您可以考虑探索一些更高级的概念，如迁移学习或者在特定领域中应用卷积神经网络等。希望您能继续保持谦虚的态度，让我们能够在您的博客中继续受益。期待着您的下一篇作品！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。