slurm单机安装部署

1:关于slurm的相关资料

slurm任务调度系统,主要应用在HPC集群资源管理和任务调度。

相关知识在网上很容易能够查找,这里就不再赘述.

网上的部署资料有些零碎,要么就要vip...., 本文主要记录如何部署slurm.

2:部署环境

使用的是虚拟机VMware,安装的操作系统是CentsOS7

CentOS8安装会存在一些麻烦,作为练手项目这里选择更简单的CentOS7

此为单机部署,集群下只有本机一个节点作为入门

3:开始部署

首先安装基础操作环境,这部分一般没有什么难点.

转好虚拟机后,确定虚拟机能够联网,以方便接下类的安装

3.1:首先是安装一些必要的环境和库

3.1.1:换源

一般当前的镜像源是找不到包的...所以换国内的源

yum install epel-release

3.1.2:装环境

安装一些后续运行所依赖的环境

yum install -y rpm-build bzip2-devel openssl openssl-devel zlib-devel perl-DBI perl-ExtUtils-MakeMaker pam-devel readline-devel mariadb-devel python3 gtk2 gtk2-devel gcc make

3.2:安装munge

这一步倒是很少出错,

1:移除之前可能错误安装的munge和munge用户,

yum remove -y munge munge-libs munge-devel
userdel -r munge

2:开始安装munge,并启动munge服务

yum -y install munge munge-libs munge-devel -y
/usr/sbin/create-munge-key
systemctl enable munge --now

3.3 :安装PMIX

这里选择源码安装,源码地址https://github.com/openpmix/openpmix/releases

这里下载的是3.2.4版本,下载后放到桌面即可,当然其他位置也行

cd切换到包的目录解压

//解压
tar -zxvf pmix-3.2.4-2.tar.gz
//进入解压后的目录
cd pmix-3.2.4
//安装依赖库
yum install -y hwloc-devel libevent-devel
//安装pmix
./configure && make install -j $(nproc)

 3.4:安装slurm

3.4.1 :还是先下载,slurm版本一般没有坑,下载新版的即可,重要的是配置文件slurm.config和service文件位置

这里仍然是放到了桌面解压安装

//如果下载的是不同版本,注意文件名字即可
tar --bzip -x -f slurm*tar.bz2
cd slurm-23.02.3/
./configure && make install -j $(nproc)

3.4.2: 之后就是slurm.conf文件了,这里极易出错,建议去slurm官网生成

进入slurm官网Slurm Workload Manager - Documentation (schedmd.com)

 

 这里关键信息要填写,其他的可以保持默认


ClusterName :集群名子,随便写一个,但是要与后面的对应

SlurmctldHost:这个必须正确,获取方法,打开一个终端框

                输入hostname -s 可以看到,通常的主机名为localhost

nodename 因为是单机单节点所以是本机名字,同上

nodeaddr 单节点,这里填本机IP地址,    获取方式:命令框输入ip addr,可以在ens33列后面看到

SlurmUser 最好写root

Default MPI Type 可不选,这里选PMIX

Process Tracking 这里选LinuxProc

Resource Selection Cons_res

Job Accounting Gather Linux

点最后的submit会跳转到网页生成配置文件的代码

在虚拟机中用命令新建一个文本文件,

touch slurm.conf

chmod 777 slurm.conf

将生成网页中的所有代码粘贴到文本文件中 


 3.4.3:将填写好的的配置文件放到/usr/local/etc下

cp slurm.conf /usr/local/etc

3.4.4:然后cd切换到之前解压的slurm-23.02.3文件下.执行

cd ./etc/
chmod 755 *.service && cp *.service /etc/systemd/system
cd /etc/systemd/system

3.4.5:启动slurm服务

systemctl enable slurmctld --now
systemctl enable slurmd --now
sinfo

 能看到节点up说明安装成功

4:提交一个作业运行测试验证

创建作业job.sh

touch job.sh

vim job.sh

编辑:注意,这里将输出打印到了桌面,每个人虚拟机的桌面路径位置是不同的

应当修改output=/home/mohua/Desektop/output.txt

这里的路径信息,修改为自己的路径即可

#!/bin/bash
#SBATCH --job-name=myjob
#SBATCH --output=/home/mohua/Desektop/output.txt
#SBATCH --time=5:00

echo "This is my job."
echo "The current working directory is: $PWD"
echo "The date is: $(date)"
echo "The hostname is: $(hostname)"

 提交作业:

sbatch job.sh

 可以看到生成了output.txt

成功^_^

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
Slurm是一个用于作业调度和管理的开源软件。它被广泛应用于各种场景,包括本地服务器集群、混合云计算和云端计算等。在本地服务器集群中,Slurm可以组织多台服务器进行计算任务的调度和编排。在混合云计算环境中,Slurm同样可以使用,可以直接让供应商提供技术支持。云端的计算和超算中心也使用Slurm进行作业编排,而且云端环境不需要自己部署,直接使用即可,并且由专业的公司维护,稳定性更高。此外,还有一些开源工具可用于部署和管理Slurm集群,例如Omnia。Omnia是Dell HPC推出的开源集群部署工具,基于ansible进行部署k8s/slurm集群。你可以在GitHub上找到有关Omnia的更多信息。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [基于Centos7的slurm集群部署方案(测试环境)](https://blog.csdn.net/mogui60/article/details/125069490)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [Slurm集群部署](https://blog.csdn.net/weixin_31105189/article/details/113999400)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [Slurm集群安装部署](https://blog.csdn.net/qq_31910613/article/details/123983153)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值