报错-模型训练: RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environmen

现象

模型训练时有如下报错:

    torch._C._cuda_init()
RuntimeError: CUDA unknown error - this may be due to an incorrectly set up environment, e.g. changing env variable CUDA_VISIBLE_DEVICES after program start. Setting the available devices to be zero.
INFO - 2023-09-27 10:32:31,872 - core - signal_shutdown [atexit]

原因

不知道

解决方法

安装nvidia-modprobe即可:

sudo apt-get install nvidia-modprobe

继续报错

现象

执行nvidia-smi时报错:

/usr/bin/nvidia-modprobe: unrecognized option: "-s"

ERROR: Invalid commandline, please run `/usr/bin/nvidia-modprobe --help` for
       usage information.

原因

nvidia-modprobe版本过低,与显卡驱动的版本不匹配导致的。

解决方法

1 下载与显卡驱动一致的nvidia-modprobe
官方下载地址为https://developer.download.nvidia.cn/compute/cuda/repos/ubuntu1804/x86_64/
对应好系统版本和CPU位数,我的电脑用的是Ubuntu 18.04 + x86_64
下载与nvidia-driver对应的版本即可:

http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/nvidia-modprobe_470.182.03-0ubuntu1_amd64.deb

2 安装nvidia-modprobe

sudo dpkg -i nvidia-modprobe_470.182.03-0ubuntu1_amd64.deb

3 检查nvidia-smi是否报错

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
这个错误通常表示在设置 CUDA_VISIBLE_DEVICES 环境变量后,程序尝试在没有可用 GPU 设备的情况下运行。这可能是由于以下原因之一引起的: 1. 没有正确安装 CUDA 驱动程序:请确保您已正确安装了与您的 GPU 相匹配的 CUDA 驱动程序。您可以从 NVIDIA 官方网站下载并安装适合您 GPU 的最新驱动程序。 2. CUDA 版本与 PyTorch 版本不兼容:请确保您安装的 PyTorch 版本与您的 CUDA 版本兼容。可以查看 PyTorch 官方文档中的兼容性矩阵来确定适用于您 CUDA 版本的 PyTorch 版本。 3. 硬件问题:如果您的电脑或服务器上没有可用的 GPU 设备,那么您将无法在 GPU 上运行程序。请确保您的硬件配置中包含适用于深度学习的 GPU 设备。 为了解决这个问题,您可以尝试以下几种方法: 1. 确保您已正确安装了相应的 CUDA 驱动程序,并且版本与 PyTorch 兼容。 2. 检查 CUDA_VISIBLE_DEVICES 环境变量的设置。如果您手动设置了这个变量,请确保设置正确,并且在程序启动之前进行设置。 3. 如果您没有可用的 GPU 设备,可以将程序切换到 CPU 运行模式。您可以在程序中添加以下代码,将 PyTorch 强制使用 CPU: ```python import os os.environ["CUDA_VISIBLE_DEVICES"] = "-1" ``` 这将禁用所有可用的 GPU 设备,并将计算转移到 CPU 上。 如果您尝试了以上方法仍然无法解决问题,可能需要进一步检查您的环境设置、硬件配置或安装过程中的任何错误。 希望这些信息对您有所帮助。如果您有其他问题,请随时向我提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Attention is all you

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值