前一阵子,写了一个在linux上的远程下载程序。写好后测试了几遍都没问题,但是由另外一个程序调用本程序时,system函数都失效了,查看errno的值为10,没有子进程。本以为只要保证程序单独运行时不出错,在其他进程中调用也就不会有问题,显然并非如此。
简单描述下我的程序:在程序中,多个地方调用了system函数,因为调用system函数较为方便。system创建一个进程执行调用的命令,调用的命令执行完后才继续执行下面的语句。当本程序被其他程序调用时,用到system的地方都失败了,于是用函数代替system调用,找不到替代函数的就用fork()+execl()替代。这样做程序单独调用都没有成功。原因是父子进程要同步。于是在父进程中fork完子进程后,用wait()把自己挂起来,子进程结束后,父进程继续运行。总的来说是我用for()+execl()+wait()代替了system()。
调用wait()函数,子进程返回值是-1,错误码是10—没有子进程。这是为什么呢?这是因为父进程在fork()前调用了signal(SIGCHLD, SIG_IGN)处理僵尸子进程,所以父进程再调用wait()函数时,僵尸子进程已经不存在了。所以调用wait()函数就马上返回-1的错误值。
下面简单简述对进程编程的理解。
父进程创建子进程,父进程如果不想等待子进程,父进程可以在fork()前使用signal(SIGCHLD, SIG_IGN)回收子进程。子进程先于父进程退出,子进程就变成了僵尸进程。 僵尸进程会占用系统资源,所以父进程要回收子进程。回收方法除了用signal信号函数外,还可以用wait或waitpid函数。如果父进程先于子进程退出,子进程由Init进程接管。Init进程处理僵尸子进程。
如何编写一个守护进程,可以参考一下:
http://blog.csdn.net/hairetz/article/details/4195036