问题描述
2022年02月24日业务无法访问,top命令查看负载200,cpu和内存使用正常。
cpu低而负载高也就是说等待磁盘I/O完成的进程过多,就会导致队列长度过大,这样就体现到负载过大了
问题现象
df -Th无法执行查询结果,卡住不响应,业务日志输出停止在无法访问时间点,业务日志没有报错
问题原因
查询系统/var/log/message日志,发现报错
NFS: state manager: check lease failed on NFSv4 server nas.***.cn with error 5
nfs服务端已经挂掉了,那么就会导致进程读写请求一直获取不到资源,从而进程一直是不可中断状态,导致cpu的上下文切换,造成负载很高