OpenMM超算云配置

超算云使用流程

加载所需要的模块

  1. 利用 module avail 查看当前可用的模块,例如Anaconda、CUDA、GCC等;
  2. 利用module load module-name加载所需要的模块,例如:module load CUDA/11.1

创建并激活python环境

  1. conda create --name mmcls python=3.8
  2. conda activate mmcls,若此时环境并未激活则执行 source activate mmcls
  3. 之后可通过pip install pakage-name安装所需要python包;
  4. 注意在安装mmcv-full模块时需要注意torch和CUDA的版本。

提交任务

为了方便我们可以新建一个作业脚本,命名为 run.sh,具体内容如下:

#!/bin/bash
# 加载模块
module load anaconda/2021.05
module load cuda/11.1
module load gcc/7.3

# 激活环境
source activate opennmmlab_mmclassification

# 刷新日志缓存
export PYTHONUNBUFFERED=1

# 训练模型
python tools/train.py configs/resnet18/resnet18_b32_flower.py --work-dir work/resnet18_b32_flower

通过sbatch --gpus=1 run.sh提交作业。

查看当前任务

可通过 squeue或者parajobs查看提交的作业,当作业完成后,可以看到.out为后缀的文件,里面保存作业的结果。
可通过tail -f slurm-作业ID.out实时展示训练轮次、损失等数据。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值