初学cuda,受了很多罪。因为在windows开发环境中,图形界面占用了很多gpu资源,因此从用了四年的vs转战到linux下的vim+nvcc+cuda-gdb。对用习惯了随手加断点,随便添监视的vs忠实用户来说,这个没有可视化、没有集成的开发环境实在是有点不习惯。再加上对于gpu程序初次接触,因此造成了开发时间的极大浪费。
一个bug,让我调了整整两天。
这个bug是这样的:我定义了一个设备指针,申请了一块global memory,又将该指针与一个纹理内存绑定,但是指针解引用的值与对应的纹理内存fetch的值不一致。因为我自认这个做法是按照《GPU高性能编程 CUDA实战》第七章 纹理内存 的example来的,因此很是不解(其实用过CUDA或者opengl纹理的人,可能一下就能想到是绑定纹理出了问题)。
为什么出问题?原因就在于我使用了二维纹理。根据http://www.opengpu.org/forum.php?mod=viewthread&tid=670这篇文章的描述。linear memory(我理解的就是普通的global memory)只能与一维纹理绑定,只有CUDA Array才能与二维纹理和三维纹理绑定。但是上述书籍中的实例,linear memory与二维纹理绑定的例子确实也在用。但为什么我的代码就会出问题呢?
直接宣布答案:当使用linear memory与二维纹理绑定时,每一维的大小必须都是2的n次幂,