centos下安装slurm

centos下安装slurm

控制节点node16
计算节点node16,node18


删除安装失败的slurm

yum remove slurm  -y
cat /etc/passwd | grep slurm
userdel - r slurm

创建用户

export SLURMUSER=412 
groupadd -g $SLURMUSER slurm 
useradd -m -c "SLURM workload manager" -d /var/lib/slurm -u $SLURMUSER -g slurm -s /bin/bash slurm

查看slurm用户组id是否一致,控制节点和所有计算节点都要一样

id slurm

安装slurm

先装epel库:

yum install epel-release

装slurm的依赖包:

yum install openssl openssl-devel pam-devel numactl numactl-devel hwloc hwloc-devel lua lua-devel readline-devel rrdtool-devel ncurses-devel man2html libibmad libibumad -y

如果出现以下报错:
这里写图片描述
直接卸载冲突部分再重新运行上述命令即可:

yum -y remove ibacm-1.2.0-1.el7.x86_64
yum -y remove libipathverbs-1.3-2.el7.x86_64   
yum -y remove ibacm-1.2.0-1.el7.x86_64      
yum -y remove libipathverbs-1.3-2.el7.x86_64

装rpm:

yum install rpm-build

下载slurm:

wget https://www.schedmd.com/archives.php/downloads/archive/slurm-17.02.4
  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Slurm是一个开源的集群管理和作业调度系统,可用于管理和调度大规模的计算集群。CentOS是一种现代和可靠的Linux发行版,常用于构建服务器环境。下面是关于在CentOS安装Slurm的一些步骤: 1. 安装依赖软件包:在CentOS安装Slurm之前,需要先安装一些必需的软件包。可以使用以下命令安装这些软件包: `yum install munge munge-libs munge-devel mariadb mariadb-server mariadb-devel openssl openssl-devel readline readline-devel pam pam-devel numactl numactl-devel hwloc hwloc-devel rrdtool-devel bzip2` 2. 配置Munge:Munge是一个用于身份验证和加密的工具。在安装Slurm之前,我们需要配置和启动Munge。可以使用以下命令配置Munge: `echo "RANDOMBOB" | sudo tee /etc/munge/munge.key`,然后执行以下命令启动Munge: `sudo systemctl enable munge`,`sudo systemctl start munge` 3. 配置MariaDB:Slurm需要一个数据库来存储和管理作业信息。在安装Slurm之前,我们需要配置和启动MariaDB。可以使用以下命令配置MariaDB: `sudo systemctl enable mariadb`,`sudo systemctl start mariadb`,然后执行以下命令设置MariaDB的root密码: `sudo mysql_secure_installation` 4. 安装Slurm安装Slurm需要从源代码进行编译。可以从Slurm的官方网站上下载最新的源代码包(tar.gz格式)。下载完成后,解压缩文件,进入解压缩后的目录。然后使用以下命令进行配置和编译: `./configure --prefix=/usr --sysconfdir=/etc/slurm --enable-pam --with-mysql_config=/usr/bin/mysql_config --with-munge=/usr/bin/munge`,`make`,`sudo make install` 5. 配置Slurm:在安装完成后,需要对Slurm进行配置。可以编辑 `/etc/slurm/slurm.conf` 文件来配置集群和作业的参数。根据需要修改文件中的配置项。 6. 启动Slurm:配置完成后,可以使用以下命令启动Slurm: `sudo systemctl enable slurmd`,`sudo systemctl start slurmd`,`sudo systemctl enable slurmctld`,`sudo systemctl start slurmctld` 通过以上步骤,我们可以在CentOS上成功安装和配置Slurm集群管理和作业调度系统。 ### 回答2: Slurm是一种用于高性能计算(HPC)集群管理的开源软件。CentOS是一种流行的Linux操作系统。要在CentOS安装Slurm,您需要按照以下步骤进行操作: 1. 在CentOS安装依赖软件包:使用命令`sudo yum install epel-release`安装EPEL软件包,然后使用命令`sudo yum update`进行系统更新。 2. 下载Slurm软件包:您可以从Slurm官方网站(https://www.schedmd.com/downloads.php)下载最新版本的Slurm软件包。然后使用命令`tar -zxvf slurm-xxx.tar.gz`解压缩软件包。 3. 编译和安装Slurm:进入解压缩后的Slurm目录,执行以下命令进行编译和安装: - `./configure` - `make` - `sudo make install` 4. 配置Slurm:创建配置文件`slurm.conf`,其中包含有关集群和节点信息的详细配置。您可以复制示例配置文件,并根据您的集群设置进行修改。将`slurm.conf`文件放置在`/usr/local/etc`目录下。 5. 启动Slurm:使用以下命令启动Slurm服务: - `sudo systemctl start slurmd`(对于各个节点) - `sudo systemctl start slurmctld`(对于主控节点) 6. 验证安装:使用命令`sudo sinfo`或`sudo sacctmgr list clusters`来验证Slurm安装和配置。您应该能够看到有关节点和集群的信息。 以上是安装SlurmCentOS的基本步骤。请注意,这只是一个简单的概述,不包含所有细节和特殊设置。在实际安装中,您可能还需要进行其他配置和调整以适应您的特定需求和环境。建议您参考Slurm的官方文档或向相关社区提问以获取更多帮助和支持。 ### 回答3: Slurm是一个用于管理和调度高性能计算集群资源的开源软件。CentOS是一种基于Linux的操作系统,适用于服务器和大型计算集群环境。 要在CentOS安装Slurm,需要按照以下步骤进行操作: 1. 首先,确保CentOS系统已经安装并处于最新状态。可以使用以下命令进行更新: ``` sudo yum update ``` 2. 接下来,需要安装Slurm的依赖软件包。可以使用以下命令安装这些软件包: ``` sudo yum install munge munge-libs munge-devel openssl openssl-devel pam-devel numactl numactl-devel hwloc hwloc-devel lua lua-devel readline readline-devel rrdtool-devel rrdtool ``` 3. 下一步是安装Slurm软件包。可以从Slurm的官方网站(https://www.schedmd.com/downloads.php)上下载最新的Slurm源代码包,然后使用以下命令进行编译和安装: ``` tar xzf slurm-<version>.tar.gz cd slurm-<version> ./configure --prefix=/usr/local/slurm make sudo make install ``` 4. 在Slurm安装完成后,需要对系统进行一些配置。可以使用以下命令创建必要的目录: ``` sudo mkdir /var/spool/slurmctld sudo mkdir /var/spool/slurmd sudo chown slurm: /var/spool/slurmctld sudo chown slurm: /var/spool/slurmd ``` 5. 然后,编辑Slurm的配置文件。可以使用以下命令打开配置文件: ``` sudo vi /usr/local/slurm/etc/slurm.conf ``` 在配置文件中,可以设置集群的参数,例如节点数量、分区、资源分配策略等。 6. 最后,启动和配置Slurm服务。可以使用以下命令启动Slurm服务: ``` sudo systemctl enable munge sudo systemctl start munge sudo systemctl enable slurmd sudo systemctl start slurmd sudo systemctl enable slurmctld sudo systemctl start slurmctld ``` 以上命令将启动Munge认证服务、Slurmd节点管理服务和Slurmctld集中控制服务。 完成这些步骤后,SlurmCentOS上的安装就完成了。接下来,您可以使用Slurm的命令和功能来管理和调度集群资源进行高性能计算。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值