python学习笔记——multiprocessing 多进程模块Process

最新推荐文章于 2024-08-01 17:20:42 发布

weixin_33755649

最新推荐文章于 2024-08-01 17:20:42 发布

阅读量1.2k

点赞数

文章标签： python 操作系统运维

系统自带的fork模块创建的多进程是基于Linux或Unix平台的，而window平台并不支持；

python中的multiprocess为跨平台版本的多进程模块，支持子进程、通信和共享数据、执行不同形式的同步，提供了Process（进程）、Pool（进程池）、Queue（队列）、Pipe（管道）、Lock等组件

1 Process进程

1.1 Process进程基础语法

创建进程的类：

Process([group [, target [, name [, args [, kwargs]]]]])

group：实质上不使用，线程组，目前还没有实现，库引用中提示必须是None

target：调用对象/目标函数

name：给进程赋予一个名字

args：调用对象的位置参数元组 / 按位置给目标函数传参

kwargs：调用对象的字典 / 以字典形式向目标函数传参

实例方法：

p为进程对象的属性

p.start() 启动某一个进程

p.join([timeout]) 主进程阻塞等待子进程timeout时间后的退出，在时间内若主进程已执行完成，暂时不会退出，而是等待子进程的退出，然后处理子进程后自己再退出

p.is_alive() 进程的状态

p.run() 调用run方法，如果实例进程时未制定传入target，这star执行t默认run()方法。

p.terminate() 不管任务是否完成，立即停止工作进程。

属性：

p.name 创建的进程的名称

p.authkey

p.exitcode(进程在运行时为None、如果为–N，表示被信号N结束）。

p.pid 创建的子进程PID号

p.daemon 若设置必须置于start调用前进行(和线程的setDeamon功能一样（将父进程设置为守护进程，当父进程结束时，子进程也结束)；

默认为false，即主进程执行结束后不退出，等待子进程执行后先退出，然后主进程再退出；

设置为True时，主进程执行后立即退出，并且该主进程的所有子进程也退出

1.2 进程的创建步骤

一般步骤为

（1）确定事件，将事件封装为函数

（2）调用Process类生成响应的子进程对象

（3）调用start()运行子进程

1.3 基本示例

import multiprocessing as mp

def test():
    pass

p = mp.Process(target=test) # 创建子进程
p.start() # 开始执行子进程
p.join() # 等待子进程结束

注意：

1、Process对象可以创建进程，但Process对象本身不是进程。

2、主进程执行完毕后会默认等待子进程结束后回收资源，不需要手动回收资源；join()函数来控制父子进程的结束顺序，待子进程结束后清理子进程所有信息并回收资源。

3、采用Process对象创建进程后，子进程会将主进程的Process对象完全复制一份，这样父子进程各有一个Process对象，p.start()启动子进程，主进程中的Process对象作为静态对象存在，不执行。

4、当子进程执行完毕后，产生的“僵尸进程”会被join()函数回收；或者再有另一条进程开启，start()函数也会回收“僵尸进程”，所以不一定需要写join函数。

5、window系统平台中的子进程结束后会立即自动清除子进程的Process对象，而linux系统平台中的子进程Process对象结束后，如果没有join()函数或start()函数时则会在主进程结束后统一清除。

另外还可以通过继承Process对象来重写run方法创建进程，这里不再赘述。

1.4 示例

1.4.1 Process创建子进程

import multiprocessing as mp
from time import sleep
from random import randint
import os

def test():
    sleep(randint(0,4))
    print(os.getppid(),'-------',os.getpid())
    print("Testing")

for i in range(5):
    p = mp.Process(target=test) #原test()函数已经不是普通的函数，Process对象已经将其转变成进程。
    p.start()

运行

4710 ------- 4711
Testing
4710 ------- 4715
Testing
4710 ------- 4712
Testing
4710 ------- 4713
Testing
4710 ------- 4714
Testing

说明：从运行结果可知，PID=4710的父进程创建了5个子进程（不同的PID对应不同的子进程）。

1.4.2 元组传参

import multiprocessing as mp
from time import sleep

a = 10

def worker(sec):
    print(a)
    sleep(sec)
    print('worker ......')
    print(a)

p = mp .Process(name = 'child', target = worker,args = (5,)) #元组传参

#p进程对象的属性
# p.daemon = True
p.start()  #启动进程
print(p.pid)  #创建的子进程的ＰＩＤ号
print(p.name) #创建的进程的名称
print(p.is_alive()) #进程的状态

a = 100000

p.join() #主进程阻塞等待子进程的退出
print("************main****************")

worker(1)

运行

5399
child
True
10
worker ......
10
************main****************
100000
worker ......
100000

注意：

（1）元组传参args = (5,) 而非args = (5) ，一个元素时需注意。

（2）当创建子进程后，在主进程中重新绑定变量值时，子进程中的变量不会变化。

（3）p.daemon = True / False，

daemon(守护进程)默认是False，即主进程（阻塞）会等待子进程结束；

True则为直接结束主进程，子进程也随之结束，当主进程中加入阻塞函数join时，该句失效。

1.4.3 字典传参

import multiprocessing as mp
from time import sleep
import os

a = 100

def worker(sec,msg):
    print(a)
    sleep(sec)
    print(os.getppid(),'-------',os.getpid())
    print(msg)
    print(a)

for i in range(5):
    p = mp.Process\
    (name = 'Child%d'%i,target=worker,
 #       args = (2,"child process"),\
        kwargs={'sec':2,'msg':"child process"})
    p.start()

sleep(1)
a = 100000

p.join()

运行

100
100
100
100
100
5590 ------- 5592
child process
100
5590 ------- 5591
child process
100
5590 ------- 5593
child process
100
5590 ------- 5594
child process
100
5590 ------- 5595
child process
100

说明：

（1）这里面中的字典传参与元组传参的可以相互替代，但元素传参需注意位置关系

（2）开始时输出连续打印出100是由于子进程中sleep()所致，当去掉时，连续执行数次（>3）时100均非连续；同时子进程PID号也是乱序（此也说明子进程相互独立）。

1.4.4 在window平台系统

from multiprocessing import Process  #导入Process模块
import os

def test(name):
    '''
    :param :
    :return:
    下段代码适用于Linux中运行，因windows下os模块不支持getppid()
    '''
    print("Process ID： %s" % (os.getpid()))
    print("Parent Process ID： %s" % (os.getppid()))


# windows下，创建进程的代码一下要放在main函数里面
if __name__ == "__main__":
    proc = Process(target=test, args=('nmask',))
    proc.start()
    proc.join()