linux c 启动子进程,Linux下调用fork或system启动子进程的信号和资源释放相关问题...

在以system( )启动py脚本的实现过程中,遇到了两个问题:

(1)调用system启动py脚本创建保护子进程时,Python报下列错误:

[root@otctest bin]$ Traceback (most recent call last):

File "gatherclient_daemon.py", line 295, in ?

main(sys.argv)

File "gatherclient_daemon.py", line 273, in main

Run()

File "gatherclient_daemon.py", line 243, in Run

daemon = Daemon()

File "gatherclient_daemon.py", line 30, in __init__

self.system = platform.system()

File "/usr/lib/python2.4/platform.py", line 1035, in system

return uname()[0]

File "/usr/lib/python2.4/platform.py", line 1007, in uname

processor = _syscmd_uname('-p','')

File "/usr/lib/python2.4/platform.py", line 794, in _syscmd_uname

rc = f.close()

IOError: [Errno 10] No child processes

可以发现原因是找不到子进程。排查gatherclient C程序,发现原来是因为我这个python程序本身是由gatherclientC程序调用的,gatherclient及py脚本均是以守护进程的模式在后台运行,而调用它的gatherclient程序中将SIGCLD信号忽略了(这表明system( )是根据子进程退出时产生的信号来获取返回值的),所以主进程gatherclient将不再接收子进程的返回值。为了解决这个问题且不造成子进程变成僵尸进程,修改代码:

signal(SIGCHLD,SIG_DFL);                //默认处理方式,是接收子进程的返回值。

从下面的源码分析可看出 system( )的实现:

int system(const char * cmdstring)

{

pid_t pid;

int status;

if(cmdstring == NULL)

{

return (1);

}

if((pid = fork())<0)

{

status = -1;

}

else if(pid == 0)

{

execl("/bin/sh", "sh", "-c", cmdstring, (char *)0);

_exit(127);

}

else

{

while(waitpid(pid, &status, 0) < 0)

{

if(errno != EINTR)

{

status = -1;

break;

}

}

}

return status;

}

2.6内核下当父进程未调用wait系列函数等待子进程结束且未显式地忽略SIGCHLD信号,则子进程将成为僵死进程(如果显示忽略,则子进程不僵死);因而在SIGCHLD信号被显式忽略的情况下,2.6内核子进程将直接退出并释放资源,等父进程调用waitpid时,发现对应的pid进程已不存在,因而返回-1错误,errno为10(No child  processes);

(2)py脚本及gatherclient文件更新后(gatherclient自动退出),py脚本自动拉起gatherclient程序时,父进程gatherclient拥有的资源在子进程退出前未释放的问题。

分析后发现是由于gatherclient中的一处文件锁未释放导致。gatherclient实现时,保证客户端正常地收集系统运行状态信息及告警,要确保在系统中只有一个客户端进程存在,程序初始化时创建了一个排他性的进程锁(文件锁),而py脚本是gatherclient进程中以system调用产生子进程的方式启动,即py子进程继承了父进程gatherclient的所有资源,包括文件锁,socket套接字资源等。根据上面的fork的理解:

新进程和原有进程的可执行程序是同一个程序;上下文和数据,绝大部分就是原进程(父进程)的拷贝,但它们是两个相互独立的进程!

父进程gatherclient退出时,它所持有的文件锁和socket资源自动释放,但问题在于父进程和子进程是两个独立的进程,py子进程并未退出,会一直持有先前父进程打开的文件锁和socket资源。这样当py脚本启动gatherclient时,就会出现文件锁已打开,无法启动的问题。解决办法是自己重写system(),在其中调用fork( )之后产生的子进程中关闭父进程打开的文件锁,socket套接字以释放资源。(实际调试测试表明,子进程未退出前,先前打开的socket套接字不会关闭且有效,程序中因此出现了socket超时才被关闭的情况)部分代码如下:

在Linux下进行多进程程序的开发,要十分注意父子进程的资源的继承关系。0b1331709591d260c1c78e86d0c51c18.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值