- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 浅谈cuda5.0新功能——warpshuffle
warpshuffle 的具体定义可以在cuda C programming guide中被找到。但是这一功能只能被sm30或者更高的显卡支持,具体原因涉及到了kepler和fermi之间的差别。 kepler在一个时钟周期内可以执行32个线程,也就是说在一个时钟周期内可以执行一个完整的warp, 但是fermi的每时钟周期执行能力只有kepler的一半,这就导致fermi不能同时对一个war
2013-01-10 03:17:41 1016
原创 如何解决cuda 5.0 编译dynamic parallelism 功能代码时的 fatal error
无论是使用Linux还是VS,如果你想实现dynamic parallelism的编译,都必须提前进行一些设置。否则你可能会遇到如下一些错误:fatal error: Unresolved extern function 'cudaGetParameterBuffer'fatal error: Unresolved extern function 'cudaLaunchDevice'n
2013-01-10 03:04:21 1465
转载 CUDA技术帖: 3D texture linear data VS 3D cudaArray
众所周知,Global memory没有Cache,访问速度很慢,Shared memory访问速度很快,但是容量很小,对于较大的数组,将其绑定至texture memory往往是个不错的选择。Texture memory可以cache,而且容量很大。 在当前的CUDA版本中,3D的线性内存是无法直接绑定到texture memory,一维的可以,因此,需要将数据首先放进一个3D的CUDA
2012-10-19 11:58:01 1109
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人