起因:nfs服务器挂掉之后,挂载点并不会提示文件找不到,而且不停的访问nfs服务器,导致线程锁死,进而导致服务崩掉。
解决方案:
1、挂载nfs时,使用类似如下命令
mount -t nfs -o soft,intr,timeo=2,retry=5 192.168.1.131:/home/share /home/share
soft:使用软挂载的方式挂载系统,若Client的请求得不到回应,则重新请求并传回错误信息。
intr:允许NFS中断文件操作和向调用它的程序返回值。
timeo=n:从超时后到第1次重新传送占用的1/7秒的数目,默认值是7/7秒。
retry=n:在放弃后台mount操作之前可以尝试的次数,默认值是7 000次。
(timeo和retry找到多种说法,有的说timeo的值为1/10秒,默认值为0.7秒;retry的值为分钟,默认10000min,这个试了一下明显错误)
上面那条命令在超时的情况下,基本上1s内就会返回错误。
2、增加nfs全局判断标识,如果nfs断开,更改标识,之后的请求跳过访问nfs服务器
3、增加定时器,定时判断nfs连接是否成功,成功后改回nfs标识。
以下是两种通过线程判断nfs连接是否成功
public Boolean nfsConn1(final String nfsPath){
Thread t1 = new Thread() {
public void