CUDA_ERROR_LAUNCH_TIMEOUT
运行时间超过5秒的线程就会被杀掉,解决办法调整watchdog
如果安装了 Nsight,打开Nsight Monitor→右下角Nsight Monitor options→General下WDDM TDR Enabled→False
试了一个一万行的矩阵乘法,计算只需要1秒,但是copy_to_host需要花费100s
Numpy计算耗时8s
CUDA via python
最新推荐文章于 2024-05-26 00:29:19 发布