实验室接手的网格任务里要安装 pbs 批作业系统,我与pbs的接触就这样开始了。
本来以为就是讲pbs的三个服务装好就可以完事了,现在发现那才是冰山一角。pbs_server作为服务的进程,是统一管理该集群系统中作业的manger;pbs_mom是集群系统中,具体执行作业的compute node;然后还需要一个pbs_sched,这是一个调度进程,与pbs_server服务在一起,server服务启动后,sched启动。
我原以为以上这三个配置好了,节点都能ping同,能够连上就万事大吉了,然后问题就来了。
question 1:
node‘s state is always down;
这个问题大概搁置了有两个星期,查看了很多资料检查了配置都不管用,然后又重新安装了一遍,没有变化。查到了很多,对我的问题都没有用,应该可以解决其他问题,不过也学到了一些指令,然后在某天 想到可以在CSDN上看看,然后 找到了这篇文章 service iptables stop 把防火墙关了,终于节点状态是free了。