1.概述
本博客通过VMware workstation创建了虚拟机console,然后在console内部创建了8台kvm虚拟机,使用这8台虚拟机作为集群,来部署配置和测试slurm任务调度系统。
console虚拟机配置为:4核心CPU,8G内存,20G系统盘安装OS,20G数据盘挂载到/opt,10G数据盘挂载到/home,一块NAT网卡模拟带外,一块Host only网卡模拟专用内网
在使用console部署8台kvm虚拟机之后,需要做一下操作:
- 部署console到node11-18的免密码登陆,通过sshpass+shell实现
- 部署console为NTP服务器,同步node11-18的时间到console
- 部署console为LDAP服务器,能够实现全局用户认证
- 格式化数据盘,将/opt和/home通过NFS共享给node11-18
注:
上面这部分内容涉及较多,如VMware workstation部署虚拟机console,console虚拟机部署kvm虚拟机,创建并挂载NFS全局文件系统,console到多节点的免密码登陆,NTP和LDAP服务部署等,这里不做一一详述。
2.同步时间节点
将console部署为NTP服务器之后,通过定时执行同步任务来保证所有节点时间一致:pdsh -w node[11-18] ntpdate 192.168.80.8
将该命令写入定时任务:crontab -e
*/5 * * * * pdsh -w node[11-18] "ntpdate 192.168.80.8; hwclock --systohc"
3.下载软件包
munged-0.5.12
slurm-16.05.3(该软件包因为安全漏洞问题,已经无法下载,可下载其他版本)
4.编译安装munge-0.5.12
1.创建安装目录:mkdir -p /opt/munge/munge-0.5.12
2.解压:unzip munge-munge-0.5.12.zip
3.编译:cd munge-munge-0.5.12
./configure --prefix=/opt/munge/munge-0.5.12 --sysconfdir=/opt/munge/munge-0.5.12/etc --localstatedir=/var
make && make install
注:
此时编译报错:
checking which cryptographic library to use... failed
configure: error: unable to locate cryptographic library
解决如下: