【现象描述】
按照官网正确安装mindspore 执行GPU训练,提示“Failed to create CUDA stream | Error Number: 0”
【原因分析】
此处error number 0不代表错误码为0,只是代表分配流操作失败,具体cuda返回的错误码可以在上文日志中看到,可能提示:
cudaStreamCreate failed, ret[XXX], "cuda error string".
一般来说GPU流失败很有可能是由于Nvidia驱动和cuda版本不匹配,
nvidia驱动版本需要高于cuda版本
官方给出的版本配套要求:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
【解决方法】
根据官方版本配套要求,重新安装对应版本的Nvidia驱动,即可启动训练。