1 CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.For debugging consider passing CUDA_LAUNCH_BLOCKING=1. 在代码中加入 os.environ['CUDA_LAUNCH_BLOCKING'] = '1' 可以将错误的具体位置显示出来。 以上的问题大多是网络中的label和网络输出的维度大小不一样,也就是说,类别数为6类,而网络的输出为5类。