CUDA内核错误可能会在其他API调用时异步报告,因此下面的堆栈跟踪可能是不正确的。为了调试,考虑传递CUDA_LAUNCH_BLOCKING=1。
这个错误提示告诉你,你在使用CUDA进行计算的时候可能会出现内核错误,并且这些错误可能在其他API调用时被异步报告。为了调试这个问题,你可以考虑将CUDA_LAUNCH_BLOCKING设置为1。这将使CUDA内核在调用时同步执行,并使你可以获得更准确的堆栈跟踪信息,以帮助你定位问题的来源。
CUDA内核错误可能会在其他API调用时异步报告,因此下面的堆栈跟踪可能是不正确的。为了调试,考虑传递CUDA_LAUNCH_BLOCKING=1。
这个错误提示告诉你,你在使用CUDA进行计算的时候可能会出现内核错误,并且这些错误可能在其他API调用时被异步报告。为了调试这个问题,你可以考虑将CUDA_LAUNCH_BLOCKING设置为1。这将使CUDA内核在调用时同步执行,并使你可以获得更准确的堆栈跟踪信息,以帮助你定位问题的来源。