SLURM
kongxx
这个作者很懒,什么都没留下…
展开
-
SLURM 安装与配置
SLURM 安装与配置SLURM 介绍SLURM 是一个可用于大型计算节点集群的高度可伸缩的集群管理器和作业调度系统。SLURM 维护着一个待处理工作的队列并管理此工作的整体资源利用。SLURM 将作业分发给一组已分配的节点来执行。本质上,SLURM 是一个强健的集群管理器,它高度可移植、可伸缩至大型节点集群、容错好,而且更重要的是它是开源的。关于 SLURM 的架构可以参考 http://slur原创 2015-09-02 09:06:19 · 36862 阅读 · 3 评论 -
SLURM 节点状态总是drained问题
问题描述新装的 SLURM 集群在运行了一些作业并修改一些配置项目以后,用sinfo查看信息的时候看到部分节点状态总是 drained ,但是在这个节点上并没有作业在运行,重启 slurm 服务问题依旧,如下$ sinfoPARTITION AVAIL TIMELIMIT NODES STATE NODELISTdebug* up infinite 1 drain原创 2015-09-03 09:08:26 · 24158 阅读 · 0 评论 -
SLURM Array Job
在 SLURM 中也有类似 UniScheduler 和 PBS 中 Array Job 的概念,不过它的实现有点意思,下面就说道说道。首先创建一个 shell 脚本来作为 Array Job 的一个作业,内如如下$ cat test.sh#!/bin/shsrun sleep 120然后就可以通过 sbatch 命令来提交 Array Job了,如下sbatch --array=1-10 te原创 2015-09-04 17:49:27 · 5330 阅读 · 1 评论 -
Slurm Accounting Storage 配置
Slurm Accounting Storage 配置Slurm中默认是没有配置accounting的功能的,因此如果需要手动配置打开此功能。首先,修改/etc/slurm/slurm.conf文件,这里使用文件来存储# AcctAccountingStorageEnforce=1AccountingStorageLoc=/opt/slurm/acctAccountingStorageType原创 2016-09-15 19:35:39 · 7181 阅读 · 1 评论 -
Slurm查看作业CPU和MEM
Slurm查看作业CPU和MEMSlurm中使用 squeue 和 scontrol show job 命令查询作业的时候是看不到作业的CPU和MEM使用情况的,此时我们可以使用sstat和sacct来查看作业的CPU和MEM使用情况。配置要能查看CPU和MEM,首先我们需要修改/etc/slurm/slurm.conf文件中的下面两项SelectType=select/cons_resSelec原创 2016-09-16 18:36:13 · 14380 阅读 · 0 评论 -
Slurm提交MPI作业
Slurm提交MPI作业首先准备一个MPI程序,这里使用python语言的mpi4py库写了一个helloworld.py#!/usr/bin/env python"""Parallel Hello World"""from mpi4py import MPIimport sysimport timesize = MPI.COMM_WORLD.Get_size()rank = MPI.C原创 2016-09-20 09:08:44 · 17001 阅读 · 0 评论