CUDA并行计算
文章平均质量分 88
退休码农飞伯德
这位小兄弟,看你骨骼精奇,是万中无一的编码奇才,维护世界和平就靠你了,我这里有本秘籍,我看你与你有缘,就10块钱卖给你吧!
展开
-
共享内存之bank冲突
前面我们说到了共享内存的使用方法以及一些高级特性,并简单说明了一下bank冲突,这里我们将会通过一些简单的例子来详细介绍一下bank冲突。原创 2016-11-01 07:11:55 · 1994 阅读 · 1 评论 -
在CUDA C/C++中使用共享存储器
本文主要介绍了共享内存的基本组成、特性、基本用法以及高级用法。翻译 2016-10-23 23:38:13 · 1428 阅读 · 2 评论 -
[译]CUDA C/C++如何优化数据传输
这篇文章主要介绍了如何高效地进行数据传输,其中涉及到了固定主机内存的使用以及NVIDIA性能分析工具的nvprof的使用。翻译 2016-12-05 16:27:30 · 608 阅读 · 0 评论 -
在CUDA C/C++中如何衡量代码性能
这篇文章主要介绍了如何用CUDA事件API获取核函数的执行时间。CUDA事件使用GPU计时器,因此避免了与主机设备同步相关的问题。翻译 2016-11-21 23:32:27 · 642 阅读 · 0 评论 -
深入理解CUDA点积运算
本博客主要讲述了《GPU高性能编程CUDA实战》这本书中关于点积运算中难懂的部分。原创 2015-09-03 19:42:45 · 2819 阅读 · 8 评论 -
并发计算 VS 并行计算
上一篇文章中,我们学习了如何在CUDA中隐藏数据传输,而其中用到的主要技术就是并发计算。这时你可能会问,这个专栏不是CUDA并行计算吗?怎么又说什么并发计算呢?其实,这里所说的“CUDA并行计算”并原创 2017-01-21 14:07:14 · 3974 阅读 · 0 评论 -
在CUDA C/C++中如何隐藏数据传输
在上一篇博客中,我们讨论了如何在主机和设备之间高效地进行数据传输。在这篇文章中,我们将讨论如何使用主机端的计算、设备端的计算以及某些情况下的主机与设备端的数据传输来隐藏数据传输。要实现使用其他操作隐藏数据传输需要使用CUDA流,所以首先让我们来了解一下CUDA流。翻译 2017-01-21 14:04:37 · 1290 阅读 · 0 评论