进程与线程
进程是操作系统中进行资源分配的最小单元,资源包括CPU、内存、磁盘等IO设备
线程是CPU调度的基本单位
例如:我们电脑上运行的浏览器和视频播放器就是两个不同的进程,进程可能包含多个子任务,这些子任务就是线程,比如视频播放器在播放视频时要同事显示图像、播放声音、显示字幕,这就是三个线程。
python中的多进程主要用到了multiprocessing这个库
multiprocessing
multiprocessing模块是跨平台的多进程模块,它提供了一个Process类代表一个进程对象。创建子进程时,只需要传入一个执行函数和函数的参数,创建一个Process实例,用start()方法启动,join()方法可以等子进程结束后再继续往下运行下去,通常用于进程间的同步。
# 创建一个子进程
from multiprocessing import Process
def fun(name):
print('hello', name)
if __name__ == '__main__':
p = Process(target=fun, args=('bob')) #新建一个子进程p,目标函数是fun,args是函数fun的参数列表
p.start() #开始执行进程
p,join() #等待子进程结束
Pool
如果想要创建多个子进程,就要用到multiprocessing下面的Pool进程池
进程池Pool类可以提供指定数量的进程供用户调用
当有新的请求提交至Pool中时,若进程池尚未满,就会创建一个新的进程来执行请求;
若进程池中的进程数已经达到规定的最大数量,则该请求就会等待,直到进程池中有进程结束,才会创建新的进程来处理该请求。
进程池不用频繁创建和销毁进程
Pool语法
Pool([processes[, initializer[, initargs[, maxtasksperchild[, context]]]]])
processes:使用的工作进程的数量;若processes是None,默认适用os.cpu_count()返回的数量。
initializer:若initializer是None,则每一个工作进程在开始的时候就会调用initializer(*initargs)。
maxtasksperchild:工作进程退出前可以完成的任务数,完成后用一个新的工作进程来替代原进程,让闲置的资源释放,maxtasksperchild默认是None,此意味只要Pool存在工作进程就一直存活
context: 用在制定工作进程启动时的上下文,一般使用multiprocessing.Pool()或者一个context对象的Pool()方法来创建一个池,两种方法都适当的设置了context。
如果主进程退出,则进程池中的所有进程均退出。
使用Pool创建进程池对象,同时进程池中进程已经启动,向进程池中添加事件时,事件排队执行。
这篇博客写的非常好,所以偷个懒,就不再整理了
Pool进程池