【cuda by example学习笔记】-2023.7.31

最新推荐文章于 2024-08-12 22:49:39 发布

你不会哭的

最新推荐文章于 2024-08-12 22:49:39 发布

阅读量40

点赞数 1

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_58325633/article/details/132017286

版权

常量内存

用于保存在核函数执行期间不会发生变化的数据。某些情况用常量内存替换全局内存能有效减少带宽。

修饰符：__constant__

需要使用cudaMemcpyToSymbol（）将数据复制到常量内存

常量内存中读取数据可以节省带宽的两个原因：

1.对常量内存的单独读操作会将数据广播到其他的“邻近”线程，会节约15次读操作。

2.常量内存的数据将缓存起来，对相同地址的数据进行连续读操作不会产生额外内存通信量。

“邻近”是什么意思？我们需要先了解以下线程束。

线程束

它是一个线程集合，程序的每一行，线程束中的每个线程都在不同数据上执行相同的指令。处理常量内存时，NVIDIA硬件将单次读写内存操作广播到每个半线程束，如果半线程束中每个线程都要读取常量内存中相同地址的数据，那么GPU只会产生一次读取请求，将数据广播到半线程束的每个线程，这样产生的内存流量只是使用全局内存的1/16（约6%）。实际使用中会减少更多带宽，因为硬件会主动把常量内存数据缓存在GPU上，这样当其他半线程束需要数据时，将命中缓存。同时，也可能会带来负面影响。如果半线程束上的每个线程需要访问常量内存上不同的数据，那么读取操作将被串行化，但在全局内存中读取，这些请求会被同时发出。那么怎么可以知道，产生的影响是正面的还是负面的？我们可以使用GPU的事件API。

事件

cuda中的事件本质是一个GPU时间戳。获得一个时间戳需要两个步骤：

1.创建一个事件。cudaEventCreate（）

2.记录一个事件。cudaEventRecord（）

要统计代码执行时间，我们要创建开始事件和结束事件。但是存在一个问题，对于一些异步函数，GPU执行完之前，CPU会执行程序中的下一行代码，这将使计时工作更加复杂。采用的解决办法就是一行代码：cudaEventSynchronize（），当该函数返回结果时，可以安全的读取结束的时间戳。

由于cuda事件是在GPU上执行的，因此它不适用于在CPU和GPU上混合执行的代码。

你不会哭的

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
【cuda by example学习笔记】-2023.7.31

用于保存在核函数执行期间不会发生变化的数据。某些情况用常量内存替换全局内存能有效减少带宽。修饰符：__constant__需要使用cudaMemcpyToSymbol（）将数据复制到常量内存“邻近”是什么意思？我们需要先了解以下线程束。它是一个线程集合，程序的每一行，线程束中的每个线程都在不同数据上执行相同的指令。
复制链接

扫一扫

你不会哭的 CSDN认证博客专家 CSDN认证企业博客

码龄3年

10: 原创

134万+: 周排名

23万+: 总排名

5084: 访问

: 等级

128: 积分

9: 粉丝

27: 获赞

11: 评论

61: 收藏

私信

关注

热门文章

分类专栏

PINN 1篇

最新评论

PINN及其“变种”
未~: 请问你Self-adaptive PINNs（APINNs）的内容是从哪篇论文上看到的
PINN及其“变种”
CSDN-Ada助手: 恭喜你写了第10篇博客！看到你对PINN及其“变种”的深入探讨，我感到非常欣慰。接下来，我建议你可以继续深入研究PINN及其相关领域的最新进展，或者尝试将这些理论应用到实际问题中去，这样可以为读者带来更多的启发和帮助。希望你能继续保持创作的热情，期待你更多精彩的文章！
基于Householder变换的QR分解
CSDN-Ada助手: 恭喜博主撰写了第9篇博客！尽管标题为“【无标题】”，但博文内容肯定是令人期待的。持续创作的精神值得赞赏，你在分享知识和观点的道路上迈出了坚实的一步。为了提高博文的吸引力，我建议你在下一篇博客中给文章一个有吸引力的标题，这样更容易吸引读者的关注。期待看到更多精彩的创作！加油！
【vue学习笔记】-2023.8.29
CSDN-Ada助手: 恭喜您写了第8篇博客！标题中提到了vue学习笔记和嵌套路由，让我对您的学习进展感到非常期待。不仅如此，我还注意到您使用了elementUI，这是一个非常流行和强大的前端框架。很高兴看到您不断地分享学习心得和经验。在下一步的创作中，我建议您可以考虑深入探讨vue的其他功能和特性，例如组件通信、状态管理等。希望您能继续保持谦虚的态度，持续努力，期待您的下一篇作品！
【vue学习笔记-vue-router的使用】-2023.8.28
CSDN-Ada助手: 恭喜您写了第7篇博客！标题为“【vue学习笔记-vue-router的使用】-2023.8.28”，我很高兴看到您持续不断地创作。在这篇博客中，您介绍了vue-router的使用，这是一个非常有用的主题。我很喜欢您对于vue-router的详细解释，并且感谢您分享了自己的学习心得。在下一步的创作中，我建议您可以探索更多关于Vue的知识点，比如组件化开发、状态管理等等。这些内容会进一步丰富您的博客，并且帮助读者更好地理解和应用Vue。请继续保持谦逊和努力，期待您未来更多精彩的博客！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。