一、问题现象
二、排查思路
1、挂载救援盘进入系统
2、查看secure日志
发现大量的‘’nofile配置问题报错,此时想到进程文件打开数配置有问题
3、查看文件打开数配置文件/etc/security/limits.conf
发现配置为最大10240000了,
这个时候重新配置修改为默认的1024
4、重新启动机器,正常恢复
二、关于/etc/security/limits.conf中打开文件数配置文件解释
soft xxx : 代表警告的设定,可以超过这个设定值,但是超过后会有警告。
hard xxx : 代表严格的设定,不允许超过这个设定的值。
nofile 每个进程可以打开的文件数
nproc : 是操作系统级别对每个用户创建的进程数的限制
这里 * 代表所有用户
比如:
root soft nofile 1024
root hard nofile 2048
代表,root用户打开文件数可以在1-1024之间正常使用,但是在1024-2048就会收到告警信息,如果是大于了2048就会直接报错的