CUDA语言在调试的过程有时会碰到下面的一些情况,
断点调试到cudaMalloc, cudaMemcpy, cudaThreadSynchronize不能走到下一步,而是跳到程序的最开始,会突然黑屏,显卡驱动出现故障,屏幕出现雪花,蓝屏重启等。
这些情况一般是显卡出现泄漏,出现了超出范围的访问等。但是出现的问题的地方并不一定出现跳转的这个位置,而是之前的某个地方。有个简单的检测方法就是把每个显存地址的内容拷到内存中,如果拷贝出现问题,那么就说明这块地址的操作是有问题。按如此方法可以一直追溯。
当出现同一地址的重复申请可能会出现雪花;
黑屏是 cudaMemcpy 和 cudaMalloc出错;
蓝屏重启是因为kernel指针越界;
(我遇到的是这样,不能保证完全包括所有情况,
应该这些现象是根据显存的异常不同而有所分别吧)。