这个问题很可能是代码有问题,先排查错误 step1 在environment variable中添加:CUDA_LAUNCH_BLOCKING=1 这样更容易定位到出现问题的地方 step2 再排查报错附近的原因,就在报错附近。 我今天处理NLP,出现该问题的原因是:词的索引> embedding层词量