nfs宕机无法连接,导致系统负载高,但cpu和内存进程正常无高占用,重启可直接解决,但业务机重启影响业务
现象状况:服务器使用了nfs挂载,nfs宕机后,
1、df 命令卡住,
2、w和top 查看cpu负载 虚高,无高占用cpu进程
3、挂载文件目录无法查看和进入
故障原因:
机器无法通讯nfs,客户端一直在找服务端,一些进程堵住导致cpu负载高
处理方式:
1、umonut取消挂载
显示device is busy。一般情况下,认为是被占用.
使用强制卸载 umoun -fl /data/
挂载路径过多可以查看/etc/fstab 和开机启动/etc/rc.local 内容 进行取消挂载
若挂载路径过多不清楚路径,可以yum 安装使用 strace ,示例:strace df
会显示命令卡顿在哪一处,之后将其umount -fl 了即可
之后即可使用 df 命令 和查看负载是否正常
2、df命令可以正常使用了,cpu依旧虚高
使用任意一台主机更改为nfs的 IP
安装nfs服务后,修改 /etc/export 配置
vim /etc/export/
/目录 *(rw,no_root_squash,sync)
例 /data/ops *(rw,no_root_squash,sync)
#多层目录可只配置最外面的一层,如挂了两个 /data/ops/mysql-data /data/ops/tomcat/web ,可以只配置/data/ops *(rw,no_root_squash,sync)
开启 nfs 后到故障节点上showmount -e 192.168.10.1 是否可以通讯,之后top看cpu慢慢降下来即可
5-10分钟后还是不行可以重启故障节点上的 nfs 和 rpcbind 服务