本次主要记录一下如何配置slurmdbd,并且描述一下,数据库中各个表记录了什么信息。
最新的slurm版本已经是20.02.4了,不过slurmdbd的配置方式,并无差别。
slurm - slurmdbd的安装配置方式会等到slurm组件讲完后一起说明。
1 环境准备
1个管理节点slurmcltd(192.168.0.211)
2个计算节点slurmd(192.168.0.218、192.168.0.128)
本文将slurmdbd安装到管理节点上,其他节点也可。
2 安装mysql(以5.7版本为例)
网上安装、配置mysql的教程茫茫多,所以我这里就简单写一下安装过程。
2.1 卸载Mariadb
查看是否安装了Mariadb,如果有,则需要卸载。虽然slurm也支持Mariadb,但是mysql用的人多呀~
`rpm -qa|grep maria`
`yum list installed|grep maria`
`yum remove {} -y` 删除安装的Mariadb
2.2 安装mysql
`yum install libaio perl-ExtUtils-MakeMaker numactl net-tools -y`
`tar -xvf mysql-5.7.26-1.el7.x86_64.rpm-bundle.tar`
依次执行以下命令,完成mysql的安装
rpm -ivh mysql-community-common-5.7.26-1.el7.x86_64.rpm
rpm -ivh mysql-community-libs-5.7.26-1.el7.x86_64.rpm
rpm -ivh mysql-community-client-5.7.26-1.el7.x86_64.rpm
rpm -ivh mysql-community-server-5.7.26-1.el7.x86_64.rpm
rpm -ivh mysql-community-devel-5.7.26-1.el7.x86_64.rpm
rpm -ivh mysql-community-libs-compat-5.7.26-1.el7.x86_64.rpm
2.3 启动mysql
`systemctl start mysqld.service`
查询mysql root初始密码
`grep "password" /var/log/mysqld.log`
进入数据库
`mysql -u root -p`
修改root密码,密码设置必须要大小写字母数字和特殊符号(,/';:等),不然不能配置成功
`ALTER USER 'root'@'localhost' IDENTIFIED BY '{new password}';`
2.4 可选,配置mysql的简单密码
降低密码的验证强度等级
`set global validate_password_policy=LOW;`
将密码长度设置为6位,并设置密码
`set global validate_password_length=6;`
`ALTER USER 'root'@'localhost' IDENTIFIED BY '123456';`
2.5 创建slurm的数据库
如果不执行的话,在配置slurmdbd.conf后,slurm也会帮我们去创建(root权限)
`create database slurm_acct_db;`
`create database slurm_jobcomp_db;`
3 配置slurm.conf文件
主要的配置如下
作业信息
AccountingStorageHost=cm-wsy-c16m32d200-1 指明slurndbd的hostname
AccountingStoragePort=6819 使用的端口,默认6819
AccountingStorageType=accounting_storage/slurmdbd 使用slurmdbd收集信息
已完成作业信息
JobCompHost=cm-wsy-c16m32d200-1 安装mysql的hostname
JobCompLoc=/var/log/slurm/slurm_jobcomp.log 日志信息
JobCompPass=123456 密码
JobCompPort=3306 mysql端口
JobCompType=jobcomp/mysql 使用mysql记录完成的任务信息
JobCompUser=root 用户
4 配置slurmdbd.conf文件
主要的配置如下
# Authentication info 一些munge的认证信息
AuthType=auth/munge
AuthInfo=/var/run/munge/munge.socket.2
DebugLevel=info
# slurmDBD info slurmdbd相关的配置信息
DbdHost=cm-wsy-c16m32d200-1
DbdPort=6819
SlurmUser=root
DebugLevel=verbose
LogFile=/var/log/slurm/slurmdbd.log
# Database info 连接mysql的相关信息
StorageType=accounting_storage/mysql
StorageHost=cm-wsy-c16m32d200-1
StoragePort=3306
StoragePass=123456
StorageUser=slurm
StorageLoc=slurm_acct_db
最后集群启动或者重新启动,首先要启动slurmdbd,然后再启动slurmctld
`systemctl start slurmdbd`
`systemctl enable slurmdbd`
`systemctl start slurmctld` or `systemctl restart slurmctld`
5 数据库中的各种表
slurm_acct_db
slurm_jobcomp_db
6 总结
从表中我们就可以看出,一个slurmdbd可以对应多个cluster,但是一个cluster只能对应一个slurmdbd。
大家有什么相关问题,可以在评论讨论哦~