df -h 和 du -h --max-depth=1 查出的磁盘大小不一致

本文探讨了在Linux环境下,使用`df`和`du`命令统计磁盘空间时出现结果不一致的情况。主要原因是进程对文件的持有导致的空间占用差异。当有进程打开并未释放的文件时,`df`会显示这些空间尚未被释放,而`du`则无法检测到。通过停止相关进程,如Docker,可以缩小两者间的差距。此外,文章列举了一些常用的磁盘空间管理命令,如`du -h --max-depth=1`和`df -h`等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言

对于我们很多没有系统学习过关于linux的同学都比较疑惑,为什么我们在搜的 df -h 和 du -h --max-depth=1 大小不一致,而且很多时候差距相当大。

验证

在这里插入图片描述
这是一个df -h 出来各个目录所占的目录大小。我们在进入该目录下,通过
du -h --max-depth=1
去查看目录大小。
在这里插入图片描述

可以看到与当前目前挂在12G相差很远。

1、有些进程会在一开始的时候open/unlink某些文件(多半是临时文件),这样du遍历目录的时候就找不到这些文件, 但是由于进程还没有退出,这部分空间并没有实际归还fs,因此df统计结果会大于du统计的结果。
2、删除应用程序正在调用的打开的文件,通常是清理日志的时候,直接删除,而这时句柄文件仍然存在。在df -h仍然显示空间未被释放。

由于相差比较大,这里的目录比较明显是docker产生的,这里将docker stop 然后在继续查看du 和df的目录大小差距。当我们停止docker的运行之后,在继续查看
在这里插入图片描述
在这里插入图片描述

发现df -h 和 du -h --max-depth=1 已经没有明显的差距了。

经常用到磁盘大小命令

一、du相关
du -h --max-depth=1
du -h --max-depth=1 xxx/

查看linux文件目录的大小和文件夹包含的文件数
统计总数大小
du -sh xmldb/
du -sm * | sort -nr //统计当前目录大小 并安大小 排序 超级有用
du -sk * | sort -n
du -sk * | grep guojf //看一个人的大小
du -m | cut -d “/” -f 2 //看第二个/ 字符前的文字
查看此文件夹有多少文件 ///* 有多少文件
du -ah . 查看所有文件包括隐藏文件
du xmldb/

二、df相关

df -h

三、fdisk 相关
fdisk -l 显示当前系统分区的所有信息

### 如何通过 `df -h` 命令正确解析提取磁盘使用数值 在 Linux 中,`df -h` 是一种常用的命令,用于以人类可读的方式显示文件系统的磁盘空间使用情况。然而,为了进一步处理这些数据并提取具体的磁盘使用数值,可以结合其他工具如 `awk` 或 `xargs` 来实现更精确的结果。 以下是完整的解决方案: #### 使用 `df -h` `awk` 提取磁盘使用率 可以通过以下命令提取特定列的数据(例如已使用的磁盘空间百分比): ```bash df -h | awk 'NR>1 {print $5, $6}' ``` 上述命令的作用如下: - `df -h`: 显示文件系统的磁盘空间使用情况,并以易读的格式呈现。 - `awk 'NR>1 {print $5, $6}'`: 跳过表头 (`NR>1`) 并打印第五列(即使用百分比)以及第六列(挂载点)。这有助于快速定位哪些目录占用了较多的空间[^1]。 #### 结合 `xargs` 进一步处理 如果需要对某些特定路径进行深入分析,则可以利用 `xargs` 将结果传递给另一个命令。例如,假设要查找 `/home` 下占用最多空间的前 10 个文件夹,可以运行以下命令: ```bash du /home -h --max-depth=1 | sort -hr | head -n 10 ``` 此方法虽然直接涉及 `xargs`,但它展示了如何扩展基于磁盘统计的操作链[^2]。 #### 安装必要工具 对于跨平台开发环境而言,在 Windows 编写的脚本可能因换行符差异而在 Linux 上出现问题。此时应考虑安装 `dos2unix` 工具来修正这些问题。例如: ```bash yum install dos2unix ``` 随后应用它到目标脚本上即可完成转换[^3]。 #### 示例代码展示最终效果 下面是一个综合性的 Bash 脚本实例,演示了如何自动收集所有分区及其对应的使用比例,并筛选出超过设定阈值的部分发出警告通知: ```bash #!/bin/bash THRESHOLD=90 # 设置警戒线为90% OUTPUT=$(df -hP | awk '{if ($NF != "tmpfs") print substr($0, index($0,$2))}') echo "$OUTPUT" | while read line; do USEDPCT=${line%%%*} # 获取百分号之前的字符串部分作为利用率 MOUNTPOINT=${line##* } # 取最后一个字段作挂载点名称 if (( $(echo "$USEDPCT > $THRESHOLD" | bc -l) )); then echo "[WARNING] Partition '$MOUNTPOINT' has usage of ${USEDPCT}% which exceeds the threshold!" fi done ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值