c语言中的system函数可以说是程序执行时的一道重生之门,其重生妙效犹如我们之前《透析硬链接和软链接的区别》一文中的软链接文件。然而,system函数也带来了判断返回值的烦恼!本文分享我们对system函数的返回值的理解,希望对c语言学习者有所帮助(如有错误,还望指正,谢谢)。
先给出我们理解的system函数执行原理:
fork出子进程1,该子进程1通过execl来启动bash,bash会重新fork出一个子进程2去做实际的cmdstring命令,主进程会waitpid等待此子进程1的终结(潜在地,子进程1会等待子进程2)。
理解了这个执行过程,我们很容易完备枚举出system函数返回值的各个场景了。注意,我们在本文中会将此返回值分为高8bit和低8bit两部分(具体原因看完本文即可理解)。
-
如果fork失败,则system返回-1(16bit的整体)。
-
如果execl失败(包括非法的bash和非法的cmdstring),则system返回高8bit的127。
-
如果waitpid失败但不是EINTR导致,则system返回-1(16bit的整体)且要设置errno。
-
如果waitpid失败且是EINTR导致,则system返回高8bit的0和低8bit的bash返回值(128+signal number)。
-
如果waitpid是成功的,则system返回高8bit的cmdstring的返回值和低8bit的0(0表示bash是正常终结的)。
通过上述5种情况,我们收获了关于返回值的以下启示:
-
低8bit是bash的返回值,高8bit是cmdstring的返回值。
-
waitpid期间的EINTR返回也归入bash失败的场景。
-
waitpid期间的非EINTR终结以及fork失败归入整体失败的场景。
-
execl的失败归入cmdstring失败的场景。
可见,在fork+execl+waitpid不能完美终结的情况下,也要尽量靠近完美终结时的返回值方式:高低8bit分别(独立)存储cmdstring和bash的返回值,并且倾向于将失败场景归入cmdstring的失败。这种倾向性,无可厚非,毕竟求得cmdsting的返回值是system函数的核心业务。这样,cmdstring失败的错误码里预留了127给execl失败(或bash失败),也就是说cmdstring支持的返回值范围是[0..126]了,真是让人难以接受啊。。。
另外,我们看到,cmdstring的返回值是靠waitpid返回的,而此返回值经过了多道手:子进程2、子进程1、主进程,可谓繁琐至极(考虑换别的机制了?下次我们谈popen)。。。
综上,system函数的完美终结需要以下三个条件同时成立:(status代表system函数的返回值)
1)status != -1
2)bash正常终结【即低8bit为0,或者说:WIFEXITED(status)为true】
3)cmdstring正常终结【即高8bit为0,或者说:WEXITSTATUS(status)==0】
上述引入的两个宏,具体含义如下:
WIFEXITED(status)
returns true if the child terminated normally, that is, by call‐
ing exit(3) or _exit(2), or by returning from main().
WEXITSTATUS(status)
returns the exit status of the child. This consists of the
least significant 8 bits of the status argument that the child
specified in a call to exit(3) or _exit(2) or as the argument
for a return statement in main(). This macro should only be
employed if WIFEXITED returned true.
可见,一个聚焦于bash的终结,一个聚焦于cmdstring的终结,各有分工,互有所赖:WEXITSTATUS(status)仅在WIFEXITED(status)为true时才能使用。
附上source code:(为方便理解,我们稍微做了修改)
/* If WIFEXITED(STATUS), the low-order 8 bits of the status. */
#define __WEXITSTATUS(status) (((status) & 0xff00) >> 8)
/* Nonzero if STATUS indicates normal termination. */
#define __WIFEXITED(status) ((status & 0x7f) == 0)
另外,system函数里的waitpid函数还要和SIGCHLD信号的处理保持和谐共处:在主进程中需要mask SIGCHLD,waitpid之后再unmask SIGCHLD,这个mask/unmask处理是system函数内部完成的。否则,SIGCHLD的handler将完全可能破坏掉主进程的waitpid,从而无法保证system函数返回值的正确性了(考虑这个场景:system函数的调用者的SIG CHLD的handler里也调用了waitpid,这样就架空了system函数里的waitpid)。。。