学校提供了硬件牛掰的集群,然而用了slurm管理。
直接conda activate显示找不到对应环境,在网上转了一圈没找到合适的办法。
后来一拍脑门,想到节点找不到环境的主要原因是找不到自己安装的conda,那就把bash.rc的启动代码搬进slurmrun.sh脚本,问题解决!
以下是一个slurmrun.sh脚本样例,供诸君避坑的q(≧▽≦q)
#!/bin/sh
#SBATCH --partition=standard
#SBATCH --gpus=1
#SBATCH --time=30
#SBATCH --job-name=myjob
# 以下部分的路径请全部换成你的conda安装的路径
__conda_setup="$('/home/.../miniconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
eval "$__conda_setup"
else
if [ -f "/home/.../miniconda3/etc/profile.d/conda.sh" ]; then
. "/home/.../miniconda3/etc/profile.d/conda.sh"
else
export PATH="/home/.../miniconda3/bin:$PATH"
fi
fi
unset __conda_setup
# 启动你的环境,记得替换成你的环境的名称
conda activate your-env-name
# 启动你的python程序脚本
python test.py