![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
文章平均质量分 52
zzzhe1990
这个作者很懒,什么都没留下…
展开
-
CUDA技术帖: 3D texture linear data VS 3D cudaArray
众所周知,Global memory没有Cache,访问速度很慢,Shared memory访问速度很快,但是容量很小,对于较大的数组,将其绑定至texture memory往往是个不错的选择。Texture memory可以cache,而且容量很大。 在当前的CUDA版本中,3D的线性内存是无法直接绑定到texture memory,一维的可以,因此,需要将数据首先放进一个3D的CUDA转载 2012-10-19 11:58:01 · 1080 阅读 · 0 评论 -
浅谈cuda5.0新功能——warpshuffle
warpshuffle 的具体定义可以在cuda C programming guide中被找到。 但是这一功能只能被sm30或者更高的显卡支持,具体原因涉及到了kepler和fermi之间的差别。 kepler在一个时钟周期内可以执行32个线程,也就是说在一个时钟周期内可以执行一个完整的warp, 但是fermi的每时钟周期执行能力只有kepler的一半,这就导致fermi不能同时对一个war原创 2013-01-10 03:17:41 · 978 阅读 · 0 评论 -
如何解决cuda 5.0 编译dynamic parallelism 功能代码时的 fatal error
无论是使用Linux还是VS,如果你想实现dynamic parallelism的编译,都必须提前进行一些设置。否则你可能会遇到如下一些错误: fatal error: Unresolved extern function 'cudaGetParameterBuffer' fatal error: Unresolved extern function 'cudaLaunchDevice' n原创 2013-01-10 03:04:21 · 1436 阅读 · 0 评论