下载pytorch的官方docker
在宿主机上查看nvidia-smi支持的驱动版本,得到:
Driver Version: 515.86.01
这个版本号是指NVIDIA显卡驱动程序的版本号。显卡驱动程序是连接操作系统和显卡硬件之间的桥梁,它负责管理显卡的各种功能和性能。此处的"515.86.01"是驱动程序的版本号,不同的版本号代表着不同的驱动程序版本。
CUDA Version: 11.7
这个版本号是指CUDA的版本号。CUDA是NVIDIA开发的一种通用并行计算平台和编程模型,可以利用GPU的并行计算能力加速各种计算任务。此处的"11.7"是CUDA的版本号,不同的版本号代表着不同的CUDA版本,也可能需要使用不同的驱动程序版本来支持。
这里的11.7 指的是可驱动的最高版本。下载 CUDA 的版本应低于11.7
#下面的网址查看pytorch的官方docker
https://hub.docker.com/r/pytorch/pytorch/tags
#最终选择:
docker pull pytorch/pytorch:1.13.1-cuda11.6-cudnn8-runtime
运行docker:
docker run -itd --gpus all --restart always -p 10003:10003 -p 10002:10002 -w /workspace2 -v /home/workspace:/workspace --name liuhao_pytorch_workspace 71eb2d092138 /bin/bash
#进入容器:
docker attach 6965ef070f0b475e317b48a6850d4f615d4ba7dead4431b7e0b2358f22e2dae4
配置docker的基本安装环境
apt-get update
apt-get install sudo
sudo apt-get install wget
sudo ps -e|grep ssh
为vscode安装ssh服务
sudo apt-get install ssh
sudo apt-get install openssh-server
查看ssh的状态,没有返回说明没有启动
sudo ps -e|grep ssh
启动ssh
sudo service ssh start
更改ssh配置文件
vim /etc/ssh/sshd_config
填加以下内容:
Port 10002
PermitRootLogin yes #允许root用户使用ssh登录
重启ssh服务:
sudo service ssh restart
设置新密码:
passwd root
重启后在vscode中加入如下远程配置:
Host pytorch
HostName 192.168.21.xx(你的具体的IP)
Port 10002
User root
StrictHostKeyChecking no
到此配置vscode远程登录docker完成。
安装anaconda
其实该镜像自带anaconda,下面步骤可忽略。
下载anaconda安装包:
wegt https://repo.anaconda.com/archive/Anaconda3-2022.10-Linux-x86_64.sh
sudo sh Anaconda3-2022.10-Linux-x86_64.sh
安装后:
寻找文件位置:
find -name .bashrc
查看是否写入bashrc文件:
vim ~/.bashrc
export PATH=~/anaconda3/bin:$PATH
使用
source ~/.bashrc
进行激活
再创建一个新的环境:
conda create -n your_env_name python=3.9
使用如下两行,增加新的源,提升速度:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
到此完成conda的配置。