sun grid 安装管理手册
state
为任务状态
-- qw: 表示等待状态
-- hqw: 任务挂起等待中,依赖于其他正在执行的任务,待依赖的任务完成后执行
-- Eqw: 投递任务出错
-- r:表示任务正在运行
-- s:暂时挂起(往往由于优先级更高的job抢占了资源)
-- dr:节点挂了之后,删除任务就会出现这个状态,只有节点重启之后,任务才会消失
-
前期网络环境配置(NIS+NFS服务)概述
以一台管理节点和三台执行节点作为此次配置
1. 一台管理主机(hostanme:master),ip :172.16.1.2
2. 三台执行主机(hostname:分别为node1-3) ip:172.16.1.11-172.16.1.13
环境准备--修改IP地址--关机—拍快照
一台管理节点
#管理节点
sed -i 's#222#2#g' /etc/sysconfig/network-scripts/ifcfg-eth[01]
hostnamectl set-hostname master
三台控制节点
#控制节点node1
sed -i 's#222#11#g' /etc/sysconfig/network-scripts/ifcfg-eth[01]
hostnamectl set-hostname node1
控制节点node2
sed -i 's#222#12#g' /etc/sysconfig/network-scripts/ifcfg-eth[01]
hostnamectl set-hostname node2
#控制节点node3
sed -i 's#222#13#g' /etc/sysconfig/network-scripts/ifcfg-eth[01]
hostnamectl set-hostname node3
3. OS:建议redhat 6.5以上版本,
centOS7.5
4. 安装过程中先关闭四台服务器的防火墙iptalbes
四台机器全部执行
systemctl stop firewalld.service
systemctl enable firewalld.service
5. 关闭4台服务器的selinux
命令:setenforce 0
永久关闭的话vi /etc/sysconfig/selinux 修改参数SELINUX=disabled
6. 软件:由于源代码需要编译,过程略微复杂需要很多调试工作,所以请直接使用本人提供的tar包,直接解压就可以实行安装。
7. 用了方便管理用户和数据需要配置NIS+NFS来集中管理用户home目录、sge软件和工作数据。
二.NIS+NFS服务搭建
管理服务器
1. 管理服务器配置信息
配置hostname
命令:hostnamectl set-hostname master
bash
配置hosts文件
vi /etc/hosts
添加4台服务器主机名和ip
172.16.1.2 master
172.16.1.11 node1
172.16.1.12 node2
172.16.1.13 node3
保持退出
2.配置NFS服务
创建sge目录,用于安装sge软件,服务器节点之后挂载此目录
mkdir /sge
mkdir /data
创建data目录,这个目录用于创建用户家目录,因为节点有多个用户使用,用了方便管理用户需要配置NIS+NFS来集中管理用户home目录和数据
vi /etc/exports
/sge 172.16.1.* (rw,insecure,no_all_squash,no_root_squash,sync)
/data 172.16.1.* (rw,insecure,no_all_squash,no_root_squash,sync)
安装nfs和rpcbind
yum install nfs-utils rpcbind -y
重启服务配置
/etc/init.d/nfs restart
如果重启服务工作中报错,请检查nfs是否安装成功!
rpm -qa|grep nfs
![%title插图%num %title插图%num](https://i-blog.csdnimg.cn/blog_migrate/dbe9f7e38ec6069f0b6b08a4c22dbc0b.png)
rpm -qa|grep rpcbind
![%title插图%num %title插图%num](https://i-blog.csdnimg.cn/blog_migrate/ab4f86ccd7926dfbfbd400ee4ac09e55.png)
若没有这安装nfs-utils和rpcbind
3.配置NIS服务
安装服务
yum install -y ypserv* yp-tools* ypbind* -y
修改域名
nisdomainname nismaster
永久生效修改配置文件
vim /etc/sysconfig/network
修改NISDOMAIN=nismaster
保持退出
修改ypserv.conf配置文件
vim /etc/ypserv.conf
在最后加入一行
* : * : * : none
保存退出
重启服务
systemctl restart ypserv.service
systemctl restart yppasswdd.service
7.创建sgeadmin用户
之后安装sge软件需要使用这个用户,如果不配置nis的话,每台主机都需要创建这个用户,需要相同uid和gid,不便于管理
useradd sgeadmin -d /sge/sgeadmin
(sgeadmin家目录建于/sge目录下,其他节点挂载/sge目录后,自然能读取到sgeadmin的用户信息,之后新建的用户也请创建在/sge或者data目录)
passwd sgeadmin #设置密码
生成nis数据库
/usr/lib64/yp/ypinit -m
Ctrl+D --【y】--回车
之后每创建或者删除用户,都需要进行一次此操作
执行服务配置
以node1主机为例
配置hostname
hostnamectl set-hostname node1
配置hosts文件
vim /etc/hosts将服务器ip和主机名添加进去
修改入下
172.16.1.2 master
172.16.1.11 node1
172.16.1.12 node2
172.16.1.13 node3
保持退出
挂载远程目录
创建目录
mkdir /sge
mkdir /data
挂载远程目录
mount 172.16.1.2:/sge /sge
mount 172.16.1.2:/data /data
如果mount后报错,可以尝试去管理服务器重启下nfs
systemctl restart nfs
为了在后面重启节点也能自动挂载这2个目录,将挂载信息写入系统配置文件
vim /etc/fstab
后面添加2行
172.16.1.2:/sge /sge nfs rw,hard,intr,nosuid,exec,async
172.16.1.2:/data /data nfs rw,hard,intr,nosuid,exec,async
保存退出
加入NIS域
修改域名
nisdomainname nismaster
永久生效修改配置文件
vim /etc/sysconfig/network
修改NISDOMAIN=nismaster
保存退出
安装客户端
yum install -y ypbind* yp-tools