1.Zeus配置:
SSH配置:Zeus节点需要使用原始密钥对进行ssh验证。如果你在使用hepfarm02时创建原始密钥后创建了新密钥,请按照以下代码复制公钥交给管理员,或者直接联系管理员添加公钥。
scp username@hepfarm02.phy.hep.edu.cn:/home/pku/username/.ssh/id_rsa.pub /home/yourfile
如果是第一次配置ssh,请参考这个地址:
设置SHH通过密钥登录
完成公钥的配置后,使用下列命令登录zeus服务器。
ssh zeus //启动zeus节点,在zeus节点上依然可以对于hepfarm02等节点进行访问
使用以下命令检查CUDA是否可用:
nvcc --version //检查CUDA版本
检查cudatoolkit版本,如果没有找到CUDA,请按照以下命令添加系统路径(建议在安装miniconda后进行设置 ):
vim ~/.bashrc
//在文件末尾添加下列命令行
# Load CUDA
export CUDA_HOME=/usr/local/cuda-11.5
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$CUDA_HOME/lib64
export LIBRARY_PATH=$LIBRARY_PATH:$CUDA_HOME/lib64
//执行下列命令使CUDA生效
source ~/.bashrc
2.miniconda配置:
miniconda可以创建多种虚拟环境,较为方便,下载linux版本连接:
miniconda下载链接-安装Miniconda3 Linux 64-bit版本
执行命令,将.sh文件拷贝进服务器中相应位置:
scp /YourFilePosition/ username@zeus.phy.pku.edu.cn:/YourFilePosition/
//执行安装命令
bash 文件名.sh
//执行下列命令后,可以使用conda
source ~/.bashrc
conda activate
**//conda基本命令**
conda info --envs //查看虚拟环境列表
conda create -n your_env_name python=x.x anaconda //创建新的虚拟环境
source activate your_env_name //激活环境
source deactivate //关闭虚拟环境
conda install -n your_env_name [package] //安装环境包
3.pytorch配置:
安装pytorch 1.9.0版本和numpy适配CUDA版本,建议使用清华镜像源下载。
pip install torch==1.9.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple numpy
//检查
conda list
验证pytorch是否可用:
>>python
import torch
print(torch.cuda.is_available())
>>TRUE