cuda11安装 nvidia-455配置报错 解决方法

先在ubuntu20.04装了nvidia-driver-515,
然后安装cuda11.1,安装时自动把nvidia driver设成了455,但是这个455好像损坏掉了,
在软件和更新里面切换到455时也会报错。

安装cuda时会出现类似下面这种错误

dpkg: 依赖关系问题使得 cuda-drivers-455 的配置工作不能继续:
 cuda-drivers-455 依赖于 nvidia-dkms-455 (>= 455.32.00);然而:
  软件包 nvidia-dkms-455 尚未配置。

dpkg: 处理软件包 cuda-drivers-455 (--configure)时出错:
 依赖关系问题 - 仍未被配置
正在设置 libnvidia-ifr1-455:amd64 (455.32.00-0ubuntu1) ...
因为错误消息指示这是由于上一个问题导致的错误,没有写入 apport 报告。
                                                                    dpkg: 依赖关
系问题使得 cuda-drivers 的配置工作不能继续:
 cuda-drivers 依赖于 cuda-drivers-455 (= 455.32.00-1);然而:
  软件包 cuda-drivers-455 尚未配置。

dpkg: 处理软件包 cuda-drivers (--configure)时出错:
 依赖关系问题 - 仍未被配置
因为错误消息指示这是由于上一个问题导致的错误,没有写入 apport 报告。
                                                                    由于已经达到
 MaxReports 限制,没有写入 apport 报告。
                                        dpkg: 依赖关系问题使得 nvidia-driver-455
 的配置工作不能继续:
 nvidia-driver-455 依赖于 nvidia-dkms-455 (= 455.32.00-0ubuntu1);然而:
  软件包 nvidia-dkms-455 尚未配置。

dpkg: 处理软件包 nvidia-driver-455 (--configure)时出错:
 依赖关系问题 - 仍未被配置
正在设置 cuda-cupti-11-1 (11.1.105-1) ...
正在设置 cuda-nsight-systems-11-1 (11.1.1-1) ...
正在设置 libcurand-dev-11-1 (10.2.2.105-1) ...
正在设置 cuda-visual-tools-11-1 (11.1.1-1) ...
dpkg: 依赖关系问题使得 cuda-runtime-11-1 的配置工作不能继续:
 cuda-runtime-11-1 依赖于 cuda-drivers (>= 455.32.00);然而:
  软件包 cuda-drivers 尚未配置。

dpkg: 处理软件包 cuda-runtime-11-1 (--configure)时出错:
 依赖关系问题 - 仍未被配置
正在设置 cuda-compiler-11-1 (11.1.1-1) ...
由于已经达到 MaxReports 限制,没有写入 apport 报告。
                                                    dpkg: 依赖关系问题使得 cuda-
demo-suite-11-1 的配置工作不能继续:
 cuda-demo-suite-11-1 依赖于 cuda-runtime-11-1;然而:
  软件包 cuda-runtime-11-1 尚未配置。

dpkg: 处理软件包 cuda-demo-suite-11-1 (--configure)时出错:
 依赖关系问题 - 仍未被配置
dpkg: 依赖关系问题使得 cuda-11-1 的配置工作不能继续:
 cuda-11-1 依赖于 cuda-runtime-11-1 (>= 11.1.1);然而:
  软件包 cuda-runtime-11-1 尚未配置。
 cuda-11-1 依赖于 cuda-demo-suite-11-1 (>= 11.1.74);然而:
  软件包 cuda-demo-suite-11-1 尚未配置。

dpkg: 处理软件包 cuda-11-1 (--configure)时出错:
 依赖关系问题 - 仍未被配置
正在设置 cuda-cupti-dev-11-1 (11.1.105-1) ...
由于已经达到 MaxReports 限制,没有写入 apport 报告。
                                                    由于已经达到 MaxReports 限制
,没有写入 apport 报告。
                        正在设置 cuda-libraries-dev-11-1 (11.1.1-1) ...
正在设置 cuda-samples-11-1 (11.1.105-1) ...
正在设置 cuda-command-line-tools-11-1 (11.1.1-1) ...
dpkg: 依赖关系问题使得 cuda 的配置工作不能继续:
 cuda 依赖于 cuda-11-1 (>= 11.1.1);然而:
  软件包 cuda-11-1 尚未配置。

dpkg: 处理软件包 cuda (--configure)时出错:
 依赖关系问题 - 仍未被配置
正在设置 cuda-documentation-11-1 (11.1.105-1) ...
由于已经达到 MaxReports 限制,没有写入 apport 报告。
                                                    正在设置 cuda-tools-11-1 (11
.1.1-1) ...
正在设置 cuda-toolkit-11-1 (11.1.1-1) ...
update-alternatives: 使用 /usr/local/cuda-11.1 来在自动模式中提供 /usr/local/cud
a (cuda)
update-alternatives: 使用 /usr/local/cuda-11.1 来在自动模式中提供 /usr/local/cud
a-11 (cuda-11)
正在处理用于 mime-support (3.64ubuntu1) 的触发器 ...
正在处理用于 gnome-menus (3.36.0-1ubuntu1) 的触发器 ...
正在处理用于 libc-bin (2.31-0ubuntu9.9) 的触发器 ...
正在处理用于 man-db (2.9.1-1) 的触发器 ...
正在处理用于 desktop-file-utils (0.24-1ubuntu3) 的触发器 ...
正在处理用于 initramfs-tools (0.136ubuntu6.7) 的触发器 ...
update-initramfs: Generating /boot/initrd.img-5.15.0-46-generic
在处理时有错误发生:
 nvidia-dkms-455
 cuda-drivers-455
 cuda-drivers
 nvidia-driver-455
 cuda-runtime-11-1
 cuda-demo-suite-11-1
 cuda-11-1
 cuda
E: Sub-process /usr/bin/dpkg returned an error code (1)
解决方法:

首先把nvidia-driver, cuda相关的都删除

sudo apt clean
sudo apt update
sudo apt purge nvidia-* 
sudo apt autoremove

然后感觉问题还是出在 不应该安装cuda的时候自动安装driver,
于是打开ubuntu自带的“软件和更新” -> 附加驱动,选择一个nvidia-driver安装。

如果下载的是cuda的deb安装文件,肯定是要自动安装nvidia-driver的,
为了避免这个事情,不用deb了,改用run文件安装。

$ sudo sh cuda_11.1.1_455.32.00_linux.run

要等一会,会弹出一个界面,选continue, 然后有个协议,输入"accept“,
之后会弹出如下界面,把第一项的driver去掉,然后选"install"
在这里插入图片描述
安装好之后可以看到如下提示
在这里插入图片描述

需要配置路径,
在~/.bashrc的最后加入如下两行

export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

更新配置

source ~/.bashrc

确认一下

$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Oct_12_20:09:46_PDT_2020
Cuda compilation tools, release 11.1, V11.1.105
Build cuda_11.1.TC455_06.29190527_0
### 安装配置 NVIDIA-Docker2 #### 准备工作 为了确保顺利安装NVIDIA-Docker2,在Ubuntu 20.04上需先确认已正确安装配置NVIDIA GPU驱动程序。可以通过图形界面中的“软件与更新”,选择“附加驱动”标签页来安装推荐的NVIDIA驱动版本,如`nvidia-driver-470`[^4]。 #### 更新系统包列表 在执行任何新的软件安装之前,建议刷新本地APT缓存以获取最新的可用包信息: ```bash sudo apt-get update && sudo apt-get upgrade -y ``` #### 添加必要的依赖项和支持库 确保已经安装了一些基础工具和服务,这对于后续操作至关重要: ```bash distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo apt-get update ``` 以上命令会向APT源添加NVIDIA容器运行的支持文件[^3]。 #### 安装Docker CE 如果尚未安装标准版Docker,则需要按照官方指南先行部署Docker引擎: ```bash sudo apt-get install docker-ce ``` 验证Docker服务状态: ```bash systemctl status docker.service ``` #### 部署NVIDIA Container Toolkit 接下来就是核心部分——安装NVIDIA容器工具套件,它允许Docker容器访问主机上的GPU资源: ```bash sudo apt-get install -y nvidia-container-toolkit sudo systemctl restart docker ``` 这一步骤将自动处理所有必需组件的下载和设置,并重启Docker守护进程使其生效[^1]。 #### 测试安装成果 最后通过启动一个简单的测试镜像来检验整个流程是否成功: ```bash docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi ``` 上述命令将会拉取一个支持CUDA的基础镜像,并尝试调用`nvidia-smi`命令查询当前系统的GPU状况。如果没有报错且能够正常显示设备详情,则说明安装过程顺利完成[^2]。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

蓝羽飞鸟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值