Unix/Linux操作系统中存在fork()函数,fork()调用一次,返回两次,操作系统父进程复制了一份称为子进程,然后,分别在父进程和子进程内返回。
例子来自廖雪峰课程
子进程永远返回0,而父进程返回子进程的ID。子进程只需要调用getppid()就可以拿到父进程的ID。
import os
print('Process (%s) start...' % os.getpid())
Only works on Unix/Linux/Mac:
pid = os.fork()
if pid == 0:
print('I am child process (%s) and my parent is %s.' % (os.getpid(), os.getppid()))
else:
print('I (%s) just created a child process (%s).' % (os.getpid(), pid))
运行结果如下:
Process (876) start...
I (876) just created a child process (877).
I am child process (877) and my parent is 876.
os.getpid()是调用父进程的ID,os.getppid()是活的子进程的ID
在window环境中使用multiprocessing模块
在multiprocessing模块中提供了一个Process类来代表一个进程对象
from multiprocessing import Process
import os
def run_proc(name):
print('Run child process %s (%s)...' % (name, os.getpid()))
if __name__=='__main__':
print('Parent process %s.' % os.getpid())
p = Process(target=run_proc, args=('test',))
print('Child process will start.')
p.start()
p.join()
print('Child process end.')
执行结果如下:
Parent process 928.
Process will start.
Run child process test (929)...
Process end.
p = Process(target=run_proc, args=(‘test’,))是调用了Process类,将run_proc作为了一个进程
p.start()开始这个进程
p.join()是等进程运行结束后再运行下面的程序
在启动大量的子进程时,使用进程池的方法批量创建子进程
from multiprocessing import Pool
import os, time, random
def long_time_task(name):
print('Run task %s (%s)...' % (name, os.getpid()))
start = time.time()
time.sleep(random.random() * 3)
end = time.time()
print('Task %s runs %0.2f seconds.' % (name, (end - start)))
if __name__=='__main__':
print('Parent process %s.' % os.getpid())
p = Pool(4)
for i in range(5):
p.apply_async(long_time_task, args=(i,))
print('Waiting for all subprocesses done...')
p.close()
p.join()
print('All subprocesses done.')
p = Pool(4)使用这个Pool(4)为4个进程
p.apply_async(long_time_task, args=(i,))这个函数调用了long_time_task这个函数,分别在所有的进程中运行
p.close()关闭进程,这时不能再添加进程
p.join()进程都运行结束后运行后面的程序
子进程
有时子进程不是自身,而是一个外部进程
使用subprocess模块可以让我们非常方便地启动一个子进程,然后控制其输入和输出
import subprocess
print('$ nslookup www.python.org')
r = subprocess.call(['nslookup', 'www.python.org'])
print('Exit code:', r)
运行结果:
省略
如果子进程还需要输入,则可以通过communicate()方法输入:
import subprocess
print('$ nslookup')
p = subprocess.Popen(['nslookup'], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
output, err = p.communicate(b'set q=mx\npython.org\nexit\n')
print(output.decode('utf-8'))
print('Exit code:', p.returncode)
output, err = p.communicate(b’set q=mx\npython.org\nexit\n’)这段代码是由于之前那段代码还需要其他输入,所以这里继续输入参数
进程间通信
菜逼的我以后在理解这个吧,先上廖雪峰大大的例子
from multiprocessing import Process, Queue
import os, time, random
#写数据进程执行的代码:
def write(q):
print('Process to write: %s' % os.getpid())
for value in ['A', 'B', 'C']:
print('Put %s to queue...' % value)
q.put(value)
time.sleep(random.random())
#读数据进程执行的代码:
def read(q):
print('Process to read: %s' % os.getpid())
while True:
value = q.get(True)
print('Get %s from queue.' % value)
if __name__=='__main__':
# 父进程创建Queue,并传给各个子进程:
q = Queue()
pw = Process(target=write, args=(q,))
pr = Process(target=read, args=(q,))
# 启动子进程pw,写入:
pw.start()
# 启动子进程pr,读取:
pr.start()
# 等待pw结束:
pw.join()
# pr进程里是死循环,无法等待其结束,只能强行终止:
pr.terminate()