前提场景
早上收到阿里云监控服务告警,告诉我一台nginx服务器的磁盘占用超过了百分之90
排查过程
- df -h
2.du -hs /* | sort -rh | head -10
- 分析,目录占用的空间都很小,前后对不上,可能有大文件已被删除,但没有释放空间
- 查看占用删除文件的进程号 使用lsof命令,安装命令 yum install lsof -y
- lsof +L1 查询出删除了但未释放空间的文件
当时这里有个26G大小文件被nginx占用(如果进程不重要可以重启进程),但我这是线上nginx是不能重启的。只能用其它方式让这个文件释放资源 6.cd /proc/1650450/fd ls -lh
- echo “” > 67