超算上传作业步骤

一、加载环境

查看已有的环境

module avail 

加载anaconda/2020.11

module load anaconda/2020.11

查看已创建过的conda 环境

conda env list

加载cuda11.4环境 

 module load cuda/11.4

加载cudnn 环境

module load cudnn/8.2.4_cuda11.4

查看已加载的环境

module list

 激活anaconda环境

source activate py37

二、文件上传

 三、作业提交

run.sh脚本编写

 作业提交命令

sbatch --gpus=1 ./run.sh

执行此命令后即申请到1GPU 卡、6CPU 核、60GB内存资源。作业显示为
R(Runing)状态(parajobs 命令查看作业状态)后即开始执行run.sh脚本中的
内容。

 sbatch 提交一个批处理作业脚本到Slurm。批处理脚本名可以在命令行上传
递给sbatch,如没有指定文件名,则sbatch 从标准输入中获取脚本内容。
脚本文件基本格式:
• 第一行以#!/bin/bash 等指定该脚本的解释程序,/bin/bash 可以变为/bin/sh、
/bin/csh 等。

• 在可执行命令之前的每行“#SBATCH”前缀后跟的参数作为作业调度系统参
数。
默认,标准输出和标准出错都定向到同一个文件slurm-%j.out,“%j”将被作
业号 代替。

parajjobs

查看运行情况

**************************************************************************************************************

目前暂不知晓如何在程序运行终止的时候输入scancel ID号 取消作业

  • 0
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
《国科大lsf作业调度系统和超算队列介绍.pdf》是对国家科学技术大学(以下简称国科大)的作业调度系统和超算队列进行介绍的文件。 国科大的作业调度系统采用了IBM的Load Sharing Facility(LSF)软件,LSF是一个高性能计算环境下广泛使用的作业调度和管理系统。LSF能够根据用户提交作业和集群资源的情况自动进行作业调度和管理,以提高作业的执行效率和集群的利用率。该系统能够有效地分配和管理集群的资源,提高超算的计算能力,满足用户的需求。 超算队列是指国科大超级计算中心按照一定规则和算法对用户提交作业进行分配和排队的方式。超算队列能够根据作业的优先级、资源要求等进行作业排序和调度,以保证高优先级作业和重要计算任务的优先执行。通过合理设置和使用超算队列,国科大能够充分利用超级计算资源,提高计算效率和资源利用率。 该文件介绍了国科大的LSF作业调度系统的原理和功能,包括作业提交和管理、资源的分配和调度等内容。同时也详细介绍了国科大超算队列的设置和调度策略,包括作业排队和优先级排序的算法、资源利用率的监控和统计等内容。 通过《国科大lsf作业调度系统和超算队列介绍.pdf》的阅读,用户可以了解国科大高性能计算环境下的作业调度和管理机制,以及超算队列的设置和调度策略。这有助于用户更好地使用国科大的超级计算资源,优化作业的执行效率和集群的资源利用率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zxb1771bxz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值