GPU训练提示分配流失败[cudaStreamCreate failed]

错误信息FailedtocreateCUDAstream|ErrorNumber:0通常表示CUDA流创建失败,不是错误码为0。实际的CUDA错误码可在日志中查看。此问题可能由Nvidia驱动与CUDA版本不兼容引起。解决方案是参照Nvidia的官方版本要求,安装兼容的Nvidia驱动以恢复GPU训练。
摘要由CSDN通过智能技术生成

【现象描述】

按照官网正确安装mindspore 执行GPU训练,提示“Failed to create CUDA stream | Error Number: 0”

【原因分析】

此处error number 0不代表错误码为0,只是代表分配流操作失败,具体cuda返回的错误码可以在上文日志中看到,可能提示:

cudaStreamCreate failed, ret[XXX], "cuda error string".

一般来说GPU流失败很有可能是由于Nvidia驱动和cuda版本不匹配,

nvidia驱动版本需要高于cuda版本

官方给出的版本配套要求:https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

【解决方法】

根据官方版本配套要求,重新安装对应版本的Nvidia驱动,即可启动训练。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值