Python:
真正的并行执行多任务只能在 多核CPU 上实现,但是,由于任务数量远远多于CPU的核心数量,所以,操作系统会自动
的把很多任务轮流调度到每个核心上执行。
对于操作系统来说,一个任务就是一个 进程(Process),比如:打开一个Word就启动了一个Word进程。
有些进程还不止同时干一件事,比如:Word,它可以同时进行打字、拼写检查、打印等等。在一个进程内部,要同时干多件
事,就需要同时运行多个“子任务”,我们把进程内的这些“子任务”称为 线程(Thread)
多任务的实现有3种方式:
1、多进程模式(每个进程采用一个线程)
2、多线程模式(只有一个进程,这个进程采用多线程)
3、多进程+多线程模式(比较复杂,一般不采用)
--------------------------------------------------------------------------------------------------------------------------------
多进程:
fork()系统调用
fork()系统调用(在Unix/Linux/Mac系统上可使用,在Windows上无法使用),fork()调用一次,返回两次,因为操作系统自
动把 当前进程(称为父进程) 复制了一份(称为子进程),然后,分别在父进程和子进程内返回。
子进程永远返回0,而父进程返回子进程的ID。
Python的os模块封装了常见的系统调用,其中包括fork。
常见的Apache服务器就是由父进程监听端口,每当有新的http请求时,就fork出子进程来处理新的http请求。
multiprocessing模块
multiprocessing模块提供了一个 Process 类来代表一个进程对象。
创建子进程时,只需要传入一个执行函数 和 函数的参数,就可以创建一个Process实例,用 start() 方法启动,这样创建进
程比 fork() 还要简单。
join() 方法 会等待子进程结束后再继续往下运行,通常用于进程间的同步。
Pool(from multiprocessing import Pool)
如果要启动大量的子进程,可以用 进程池 的方式批量创建子进程。
对 Pool 对象调用 join() 方法会等待所有子进程执行完毕,调用 join() 之前必须先调用 close() ,调用 close() 之后就不能继
续添加新的 Process 了。
Pool 的默认大小是CPU的核数(假设为 4 ,那么假设你要用5个子进程,第5个子进程必须等待前面某个子进程结束后才能执
行。)
子进程
很多时候,子进程并不是自身,而是一个外部进程。我们创建了子进程后,还需要控制子进程的输入和输出。
subprocess
模块可以让我们非常方便地启动一个子进程,然后控制其输入和输出。
下面的例子演示了如何在Python代码中运行命令nslookup www.python.org
,这和命令行直接运行的效果是一样的:
import subprocess
print('$ nslookup www.python.org')
r = subprocess.call(['nslookup', 'www.python.org'])
print('Exit code:', r)
运行结果:
$ nslookup www.python.org
Server: 192.168.19.4
Address: 192.168.19.4#53
Non-authoritative answer:
www.python.org canonical name = python.map.fastly.net.
Name: python.map.fastly.net
Address: 199.27.79.223
Exit code: 0
如果子进程还需要输入,则可以通过communicate()
方法输入:
import subprocess
print('$ nslookup')
p = subprocess.Popen(['nslookup'], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
output, err = p.communicate(b'set q=mx\npython.org\nexit\n')
print(output.decode('utf-8'))
print(