docker container 指定gpu设备

1, 在yaml中   Turn on GPU access with Docker Compose | Docker Docs

Example of a Compose file for running a service with access to 1 GPU device:

services:
  test:
    image: nvidia/cuda:12.3.1-base-ubuntu20.04
    command: nvidia-smi
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]

Access specific devices

To allow access only to GPU-0 and GPU-3 devices:

services:
  test:
    image: tensorflow/tensorflow:latest-gpu
    command: python -c "import tensorflow as tf;tf.test.gpu_device_name()"
    deploy:
      resources:
        reservations:
          devices:
          - driver: nvidia
            device_ids: ['0', '3']
            capabilities: [gpu]

2,   执行以下命令

docker run --rm -ti --gpus device=1 -p 8080:8080 -e DEBUG=true -e MODELS_PATH=/models -e THREADS=1 -v $PWD/models:/models quay.io/go-skynet/local-ai:master-cublas-cuda12

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要在Docker Swarm中调度GPU,你需要确保以下几点: 1. 确认你的GPU驱动和CUDA的版本,以及docker版本是否兼容。 2. 在每个节点上,安装并配置NVIDIA Container Runtime,该运行时允许Docker容器访问GPU资源。 3. 在docker-compose文件中,使用`device`参数来指定要访问的GPU设备。例如:`devices: - /dev/nvidia0:/dev/nvidia0`。 4. 在服务规范中,使用`deploy.resources`来指定GPU的使用情况。例如:`deploy.resources: reservations: devices: - driver: nvidia capabilities: gpu`。 5. 使用`docker stack deploy`命令来部署Swarm服务,并在compose文件中指定GPU相关的配置。 6. 当部署服务后,你可以使用`docker service ps`命令来检查服务是否成功运行,并且是否正确地访问了GPU。 需要注意的是,调度GPU可能需要一些额外的配置和设置,具体取决于你的硬件和软件环境。建议参考官方文档和社区资源,以获取更详细的指导。 引用: Swarm内置docker compose,可以通过docker-compose文件来进行部署,一次启动多个关联的服务。在Swarm中,我们可以使用docker stack deploy来进行Swarm服务的部署。 $ docker stack deploy ${services_name} -c ${compose_file_path} 。 引用: 通过docker node ls命令查看当前集群中有多少节点,节点的活动状况。退出集群 $ docker swarm leave --force Node left the swarm. 引用: 运行Docker的主机可以主动初始化一个Swarm集群作为Leader节点或者加入一个已存在的Swarm集群,这样这个运行Docker的主机就成为一个Swarm集群的节点。Swarm集群节点可以分为manager管理节点和work工作节点。 引用: 2377(TCP): 用来与管理器节点之间进行通信。不开放2377端口,可能会导致无法加入集群中。7946(TCP/UDP): 用于docker节点之间的通信。4789(UDP): 覆盖网络流量。 4789端口是Swarm数据路径端口的默认值,也称为VXLAN端口。防止任何不受信任的流量到达此端口很重要,因为VXLAN不提供身份验证。此端口应只对受信任的网络开放,而绝不能在外围防火墙上开放。创建集群 $ docker swarm init --advertise-addr ${IP} Swarm initialized: current node (xxx) is now a manager. To add a worker to this swarm, run the following command: docker swarm join --token xxx IP:2377 To add a manager to this swarm, run 'docker swarm join-token manager' and follow the instructions.<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值