问题场景:OTA服务器空间爆掉,上传文件失败或者终端下copy提示“No Space xxx”
问题分析:
- 使用 df -h 命令查看分区使用情况,发现 alidata 数据盘已满
- 使用 du -sh 命令查看 alidata这个文件夹大小使用情况,实际只占用了 1.8G
疑惑:另外3个G的空间被谁吃掉了? - 通过 blkid 命令查看硬盘分区情况
问题解决:网上查帖子,查到应该是之前做了删除动作,导致某些进程一直还在读文件大小,导致空间被占用
- 通过 lsof -n|grep deleted 命令查看 delete进程,可以看到 alidata 有很多 delete 进程一直在后台run,当然实际进到 /alidata/log/httpd下又看不到任何东西,如果能看到 du -sh 看 alidata也就直接反馈出问题了。
- 找到delete 进程后,用 kill -9 971 18803 18982 19046 19104 xxx 后,再看,已经没有alidata 相关的 delete进程了
- 此时再df -h,alidata数据分区的空间就正常了