docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]].

docker && dockercompose 版本

在这里插入图片描述

docker compose 内容如下

version: '3.9'
services:
  xinference:
    image: xprobe/xinference:v0.12.3
    restart: always
    command: xinference-local -H 0.0.0.0
    ports: # 不使用 host network 时可打开.
      - "9997:9997"
    network_mode: "host"
    # 将本地路径(~/xinference)挂载到容器路径(/root/.xinference)中,
    # 详情见: https://inference.readthedocs.io/zh-cn/latest/getting_started/using_docker_image.html
    volumes:
      - ~/xinference:/root/.xinference
      # - ~/xinference/cache/huggingface:/root/.cache/huggingface
      # - ~/xinference/cache/modelscope:/root/.cache/modelscope
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]
    runtime: nvidia
    # 模型源更改为 ModelScope, 默认为 HuggingFace
    # environment:
    #   - XINFERENCE_MODEL_SRC=modelscope
  chatchat:
          #image: chatimage/chatchat:0.3.1.3-93e2c87-20240829
    image: ccr.ccs.tencentyun.com/langchain-chatchat/chatchat:0.3.1.3-93e2c87-20240829
    restart: always
    # ports: # 不使用 host network 时可打开.
    #   - "7861:7861"
    #   - "8501:8501"
    network_mode: "host"
    # 将本地路径(~/chatchat)挂载到容器默认数据路径($CHATCHAT_ROOT)中
    volumes:
      - ~/chatchat:/root/chatchat_data
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey |sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list \
&& sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
sudo nvidia-ctk runtime configure --runtime=docker
sudo systemctl restart docker
### 解决 CentOS 上 Docker 设备驱动选择错误的问题 当遇到 `docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]` 错误时,这通常意味着 Docker 容器无法找到合适的 GPU 驱动程序来满足请求中的能力需求[^1]。 #### 一、确认 NVIDIA 驱动安装情况 确保主机已经正确安装了适用于 CUDA 的 NVIDIA 显卡驱动。可以通过命令 `nvidia-smi` 来验证这一点;如果该命令返回有关 GPU 使用状态的信息,则说明驱动已成功安装并配置好环境变量路径[^2]。 #### 二、设置必要的内核模块加载选项 对于某些 Linux 发行版来说,在启动过程中可能不会自动加载所需的 nvidia 模块。编辑 `/etc/modules-load.d/nvidia.conf` 文件并向其中添加如下内容: ```bash nvidia nvidia_uvm nvidia_modeset ``` 之后重启计算机使更改生效。 #### 三、安装 Nvidia Container Toolkit 为了使得容器能够访问到宿主机上的GPU资源,需要额外安装NVIDIA提供的官方工具包——NVIDIA Container Toolkit: ```bash distribution=$(. /etc/os-release;echo $VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add - curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list sudo yum install -y nvidia-container-toolkit sudo systemctl restart docker ``` 注意上述脚本针对的是基于Debian/Ubuntu系统的操作指南,请根据实际使用的Linux发行版本调整相应的软件源地址以及包管理器指令。 #### 四、运行带有 GPU 支持的 Docker 容器 完成以上准备工作后就可以尝试再次拉取支持CUDA加速计算功能镜像,并指定相应参数让其可以正常使用GPU硬件设施了。例如使用Theano框架进行科学运算时可参照下面的方式执行: ```bash sudo docker pull kaixhin/cuda-theano:latest sudo docker run --gpus all -it kaixhin/cuda-theano:latest bash ``` 这里通过`--gpus all` 参数告诉Docker守护进程允许当前会话内的应用程序调用所有的可用图形处理器单元来进行密集型任务处理工作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值