第一感觉:ulimit错误,stack超限制了
环境:centos7.8+wien2k 23
症状:不通过pbs,直接运行一切正常;通过pbs脚本后,报如上错误
排查:
1、/etc/rc.local,未解除ulimit限制;
2、selinux未关闭
3、firewall未关闭
排查后问题仍然存在
大量查询后,发现问题如下:centos 7.8在处理ulimit时有多个级别,多个次序,与centos5\6区别巨大。按照生效先后顺序,整理如下:
1、rc.local,这个是最先执行的,注意chmod +x
2、/etc/security/limits.conf
3、/etc/security/limits.d/下的文件
4、/etc/systemd/system.conf
5、/etc/systemd/system/下的文件
6、/etc/systemd/system/引导级别(multi-user.target.wants)/下的文件(对应到服务或程序名)
7、/etc/systemd/user.conf
8、/etc/systemd/user/下的文件
9、~/.bashrc中是否配置命令
本次报错,受pbs_mom服务影响,虽在rc.local、limits.conf中解除了stack限制,但是在/etc/systemd/system/multi-user.target.wants/pbs_mom.service中进行了相关限制,导致作业调度执行过程中,应用程序受到该限制影响。默认限制内容如下:
[root@node119 multi-user.target.wants]# cat pbs_mom.service | grep Li
LimitNOFILE=32768
LimitMEMLOCK=infinity
LimitSTACK=12582912
LimitCORE=infinity
[root@node119 multi-user.target.wants]#
增加注释,重启服务/重启节点后问题修复,程序正常运行。