问题现象:
1、使用 df 命令查看文件系统使用率
[root@jdhost1 ~]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda3 50G 16G 31G 35% /
/dev/sda6 751G 420G 293G 59% /bakup
/dev/sda2 976M 129M 781M 15% /boot
/dev/sda5 298G 210G 73G 75% /xm01
结果显示,/dev/sd5 磁盘分区已占用空间为 210G,挂载目录为/xm01
2、使用 du 命令查看分区大小
[root@jdhost1 ~]# du -sh /xm01
193G /xm01
实际上,du命令看到的/xm01目录占用空间为193G,而df命令看到的是210G,两者结果不一致。
原因:
系统中可能存在很多已被删除的文件,但有运行的进程正在使用这些文件的句柄,导致未释放。
du命令使用 fstat 系统调用,基于文件获取数据,可以跨多个分区操作,du不会统计被删除文件的信息。df命令使用statfs系统调用,直接读取分区的超级块信息,获取分区使用情况,如果运行中的进程持有被删除文件的句柄,分区超级块中的信息不会更改,df命令仍会统计被删除文件的信息,最终导致du和df命令统计结果不一致。
解决方法:
方法1:通过kill进程清理
1、执行lsof命令,查询当前系统中处于deleted状态的文件
lsof /xm01 2>/dev/null | grep deleted
lsof /xm01 2>/dev/null | awk '/deleted/{print $1,$2,$3,$7/1024"K",$(NF-1),$NF}'|sort -rnk4|head -30|column -t
2、参考lsof命令列出的PID,再使用kill命令结束相应进程(kill会终止进程,要先确保业务无影响)
kill <PID>
方法2:通过重启服务器清除
重启服务器,系统会停掉现有运行的进程,释放调用的deleted文件的句柄。