slurm安装遇到的问题以及解决办法

1、如何初始化分区(节点)状态(将drain状态转为idel)

sudo scontrol update NodeName=roota-X299-UD4-Pro State=RESUME

2、如何删除节点上的任务(占用的和申请中的)

(149条消息) SLURM 节点状态总是drained问题_kongxx的博客-CSDN博客_slurm drain

scancel 16(进程号)

3、查看分区信息和节点信息

查看分区信息 scontrol show partition

查看节点信息 scontrol show node

4、启动slurmd和slurmctld报错(slurmd.service: Failed with result 'exit-code'.)

在Ubuntu 16.04桌面上安装/模拟SLURM:slurmd无法启动 中国服务器网 (zgserver.com)

解决办法:

sudo slurmctld -dvvv

sudo slurmd -dvvv

5、sudo systemctl start slurmd失败,并且systemctl status slurmd中出现Failed to start slurm node daemon.时候,同时cat /var/log/slurm.log后看到cannot create proctrack context for proctrack/cgroup错误的时候。

systemctl status slurmd中修改ProctrackType的值为proctrack/linuxproc

6、slurmctld报错fatal: Invalid SelectTypeParameters: CR_MEMORY (16), You need at least CR_(CPU|CORE|SOCKET)*

引用:slurm作业系统只能同时运行一个任务 - 计算机使用与Linux交流 (Computer Usage and Linux) - 计算化学公社 (keinsci.com)

SelectType=select/cons_tres
SelectTypeParameters=CR_Core

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值