场景 1:排查 NFS 读取缓慢问题
背景:用户反馈从 NFS 共享读取文件时速度极慢,需确认是否为 NFS 性能瓶颈。
操作步骤:
-
运行
nfsiostat
监控实时读写(每2秒刷新,共5次):$ nfsiostat -h 2 5
Filesystem: nfs://192.168.1.100:/data read ops/s kB_read/s kB/read retrans avg RTT (ms) avg exe (ms) 25.6 10240 400.0 0 15.2 18.3 write ops/s kB_write/s kB/write retrans avg RTT (ms) avg exe (ms) 8.2 4096 500.0 2 32.1 45.6
-
关键指标分析:
•avg RTT (ms)
:读操作平均往返时间 15.2ms(正常应 < 20ms)。
•avg exe (ms)
:读操作总执行时间 18.3ms,表明服务端处理正常。
•retrans
:写操作重传2次,可能网络不稳定或NFS服务端响应慢。 -
进一步排查:
• 检查网络延迟:ping 192.168.1.100
• 服务端负载:在NFS服务器运行nfsstat -s
查看服务端统计。
场景 2:诊断 NFS 写入延迟突增
背景:监控系统报警 NFS 写入延迟超过阈值(>100ms),需定位原因。
操作步骤:
-
持续监控写入延迟:
$ nfsiostat -h 1 10 # 每秒刷新,共10次
Filesystem: nfs://192.168.1.100:/logs write ops/s kB_write/s kB/write retrans avg RTT (ms) avg exe (ms) 50.3 25150 500.0 15 120.5 150.2
-
关键发现:
•avg RTT
120.5ms:网络延迟过高。
•retrans=15
:大量数据包重传,可能网络拥塞或服务端磁盘IO瓶颈。 -
联合排查:
• 网络层:tcpdump -i eth0 host 192.168.1.100
抓包分析重传。
• 服务端磁盘:在NFS服务器运行iostat -x 1
,检查磁盘%util
和await
。
场景 3:验证 NFS 配置优化效果
背景:调整 NFS 客户端 rsize/wsize
参数后,需验证性能是否提升。
操作步骤:
-
优化前基准测试:
$ nfsiostat -h 2 5 > before.log $ dd if