测试环境运行的服务突然挂了,日志里面也没显示任何异样,查看机器的磁盘和内存也是正常的,于是便排查是否是进程数满了
1. 查看用户级别打开的最大进程数限制
执行命令:ulimit -a
其中max user processes 系统限制某用户下最多可以运行多少进程或线程
使用ps -eLf | wc -l 查看服务器所用线程数,发现远达不到最大限制
发现并未达到最大进程,于是便想到查看linux日志去定位问题
/var/log/messages(不同的日志系统可能日志文件不同,可能是syslog)
发现那个时间点确实有杀死进程的行为