使用colab训练模型出错,报错信息如下:
RuntimeError: CUDA error: device-side assert triggered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1
解决方法:
检查label的index发现,读取的index为 1~12,数据集中的index为1~10,12,13 。由于缺少11,导致index没有对齐。更改数据集的index为1~12后问题解决。