最近在做neutron相关工作,在neutron主进程里跑一个定时任务,并且会调用subprocess执行本地命令,但是经常会出现'pid not in children'的问题,后来发现在openstack M版本之前,如果配置了workers,即多个子进程同时工作的话,在主进程执行subprocess时很大机率会遇到'pid not in children'的warning,还会导致subprocess一直挂起,原因是neutron主进程会启一个后台线程一个监控子进程的数量,并且截断信号,导致回复给subprocess的退出信号也给截取了,
在网上查资料也很少,经过谷歌,发现一个可以完美这个问题的办法
subprocess.Popen 中有一个preexec_fn参数,作用是传入一个回调函数,在刚创建好的子进程内执行这个回调函数,既然退出信号是被父进程截取了,那么我们可以在这个子进程刚一创建好的时候执行一下os.setsid,让子进程脱离这个进程组,问题就完美解决了,
下面贴一下解决问题的代码
def _subprocess_setup():
# In I openstack neutron master process will execute os.waitpid(), this will make subprocess can't receive exit sig
# from child process
os.setsid()
# Python installs a SIGPIPE handler by default. This is usually not what
# non-Python subprocesses expect.
signal.signal(signal.SIGPIPE, signal.SIG_DFL)
def create_process(cmd, root_helper=None, addl_env=None):
"""Cre