年前做了slurm集群的安装与配置,这里写出来与大家分享一下。安装配置的时候在网上找了很多资料,发现网上的版本都比较简单,很多东西没有说清楚,这里为大家一一详细说明,希望能对需要的朋友们有所帮助。同时我如有写错的地方请大家予以纠正,谢谢!联系QQ:1192625541
Slurm安装教程
OS:centos7 machine:master(主节点,也是计算节点),slaver1,slaver2,slaver3(3个计算节点)
1.首先是关于安装账户的问题,经常可以在网上看到一些slurm的安装教程先设置了一个slurm账户。在公司的人可能比较明白。因为在公司里想要拿到root账户几乎是不可能的,那现在安装的slurm谁是管理员呢?或者说以什么账户安装呢?对的,就是slurm账户。这就是需要建slurm账户的由来。每台机器上都要建立一个slurm账户!
好的,我们先建一个slurm账户,useradd命令
2.Slurm需要安装的组件
首先先yum -y install epel-release,添加第三方源,因为你当前的镜像源有可能找不到下面的包
常用的有gtk+-2.0,用来提供对sview实时任务查询的界面支持
安装命令:yum -y install gtk2
yum -y install gtk-devel
Munge:提供组件间的认证通信机制。这个需要在所有节点安装并且启动。
安装命令:yum -y install munge
yum -y install munge-devel
这个时候需要手动创建一些文件夹,这些文件夹在上述安装munge时是不会自动建立的,需要创建。分别是/etc/munge,/var/run/munge,/var/lib/munge,/var/log/munge,所有节点都要安装munge!!!!!
命令:mkdir /etc/munge
mkdir /var/run/munge
mkdir /var/lib/munge
mkdir /var/log/munge
然后修改上述文件夹的属主为slurm
命令:chown slurm:slurm /etc/munge
chown slurm:slurm /var/run/munge
chown slurm:slurm /var/lib/munge
chown slurm:slurm /var/log/munge
然后在一台节点上(我是在主节点上)生成munge的秘钥,存储在/etc/munge中
命令:/usr/sbin/create-munge-key
修改属主为slurm: chown slurm:slurm /etc/munge/munge.key
其余节点要各拷贝一份
命令:scp /etc/munge/munge.keyroot@:/etc/munge
然后在各个节点上以slurm账户启动munge(之后不说明的地方都是以root账户)
命令:munged
PS命令查看是否启动了mung