长期生活在Linux环境中,渐渐地就有一种环保意识油然而生。比如,我们会在登录提示里写上“悟空,我跟你说过叫不要乱扔东西,乱扔东西是不对的。哎呀我话还没说完你怎么把棍子扔掉了?月光宝盒是宝物,乱扔它会污染环境,要是砸到小朋友怎么办?就算砸不到小朋友,砸到花花草草也不好嘛....”;在用户缺省目录里放一个题为“自觉保护环境,请勿堆放垃圾”的空文件,并用chattr + i设置为不可修改;看到垃圾文件就垃圾扫入/tmp目录,然后发广播通知垃圾制造者自己去/tmp认领,且警告其下不为例...我们深知,系统环境的整洁有利于系统管理员保持良好的心情、清晰的思路和稳定的工作状态。
有一类垃圾并非这么容易打扫,那就是我们常见的状态为D(Uninterruptible sleep),以及状态为Z(Zombie)的垃圾进程。这些垃圾进程要么是求而不得,像怨妇一般等待资源(D),要么是僵而不死,像冤魂一样等待超度(Z),它们在CPU run_queue里滞留不去,把Load Average弄的老高老高。怎么办呢?开枪!kill -9!看你们走还是不走,但是这两种垃圾进程偏偏是刀枪不入的,不管换哪种枪法都杀不掉它们。无奈,只好reboot,像剿灭禽流感那样不分青红皂白地一律扑杀。
悟空,我们所运维的可是24*7全天候对外客户服务的系统,怎么能动不动就reboot?我们的考核指标可是4个9(99.99%,全年计划外当机时间不得超过52分34秒),又不是4个8,你稍微遇到点事情就reboot,还要不要可用性了?再说,现在社会都开始奔和谐去了,我们对于D和Z这两种垃圾进程也该尽可能采取慈悲手段,能解决其困难的,就创造条件,解决其实际困难,能消除其冤结的,就诵经烧纸,消除其前世冤结,具体问题应具体分析具体解决...
贫道还是回到正题来,怨妇D往往是由于I/O资源得不到满足,而引发等待,在内核源码fs/proc/array.c里,其文字定义为“"D (disk sleep)", /* 2 */”(由此可知D原是Disk的打头字母),对应着include/linux/sched.h里的include/linux/sched.h里的“#define TASK_UNINTERRUPTIBLE 2”。举个例子,当NFS服务端关闭之时,若未事先umount相关目录,在NFS客户端执行df会挂住整个登录会话,按Ctrl+C、Ctrl+Z都无济于事。断开连接再登录,执行ps axf则看到刚才的df进程状态位已经变成了D,kill -9 无法杀灭。正确的处理方式,是马上恢复NFS服务端,再度提供服务,刚才挂起的df进程发现了其苦苦等待的资源,便完成任务,自动消亡。若NS服务端无法恢复服务,在reboot之前也应将/etc/mtab里的相关NFS mount项删除,以免reboot过程例行调用netfs stop时再次发送等待资源,导致系统重启过程挂起。
D是处于TASK_UNINTERRUPTIBLE的进程,深度睡眠,不响应信号。一般只有等待非常关键的事件时,才把进程设为这个状态。
冤魂Z之所以杀不死,是因为它已经死了,否则怎么叫Zombie(僵尸)呢?冤魂不散,自然是生前有结未解之故。在UNIX/Linux中,每个进程都有一个父进程,进程号叫PID,相应地,父进程号就叫PPID。当进程死亡时,它会自动关闭已经打开的文件,舍弃已占用的内存、交换空间等等系统资源,然后向其父进程返回一个退出状态值,报告死讯。如果程序有bug,就会在这最后一步出问题,儿子说我死了,老子却没听见,没有及时收棺入殓,儿子便成了僵尸。在UNIX/Linux中消灭僵死的手段比较残忍,执行ps axf找出僵尸进程的父进程号,先杀其父,然后再由进程天子init来一起收拾父子僵尸,超度亡魂,往生极乐。注意,子进程编程僵死只是碍眼而已,并不碍事,如果僵尸的父进程当前有要务在身,则千万不可贸然杀之。
注:不是所有状态为Z的进程都是无法收拾的,很可能是某个短暂的状态刚好被你发现了。