系统假死定义
应用进程存在,但是无法正常提供服务(请求没有响应,或者响应超时)。
系统假死原因
主要分为两大类:连接无法建立、请求无法处理,如下图所示:
连接数达到上限
- 查看单个进程能打开的最大句柄数,如果太小需要进行修改;
查看:ulimit -a
修改:vi /etc/security/limits.conf
- 统计各状态的连接数量
netstat -n | awk '/^tcp/ {++state[$NF]} END {for(key in state) print key,"\t",state[key]}'
- 如果ESTABLISHED占大多数,说明系统正常,已经达到单机极限,需增加机器数量;如果TIME_WAIT或者CLOSE_WAIT过多,查看博文进行排查修复。
系统负载过高
- 通过top命令查看系统平均负载,如果负载过高,查看博文进行排查修复。