今天在运行程序训练模型时,遇到这样的报错:
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
加入
import os os.environ['CUDA_LAUNCH_BLOCKING'] = '1'
报错变为:
RuntimeError: CUDA error: device-side assert triggered Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.
我仔细检查了程序,代码没有问题,后来在调试时发现输入数据中莫名其妙多了一行数据
删除多出的数据后,再运行,程序正常跑起来了。
【#学习记录】