1、守护进程:
主进程创建守护进程:
一:守护进程会在主进程代码执行结束后就终止
二:守护进程内无法在开启子进程,否则会抛出异常:AssertionError: daemonic processes are not allowed to have children
注意:进程之间是相互独立的,主进程代码运行结束,守护进程也随之终止。
1 from multiprocessing import Proscess 2 import time 3 4 def task(name): 5 pirnt('%s is running'%name) 6 7 time.sleep(3) 8 if __name__.=='__main__': 9 obj=Process(target=task,args=('yang',)) 10 obj.daemon=True #设置守护进程 11 obj.start() #发信号给操作系统 12 print('主') 13 上述执行结果会先执行print(“主”),因为程序再向操作系统发起开启子进程的请求时,主进程已经结束,故子进程不会执行。
#主进程代码运行完毕,守护进程就会结束 from multiprocessing import Process from threading import Thread import time def foo(): print(123) time.sleep(1) print("end123") def bar(): print(456) time.sleep(3) print("end456") p1=Process(target=foo) p2=Process(target=bar) p1.daemon=True p1.start() p2.start() print("main-------") #打印该行则主进程代码结束,则守护进程p1应该被终止,可能会有p1任务执行的打印信息123,因为主进程打印main----时,p1也执行了,但是随即被终止 迷惑人的例子
互斥锁:
导入 mutiprocessing 下的 Lock模块
Lock.acquire() 加锁
Lock.release() 解锁
进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的。
如果我们不加以控制带来的就是错乱,这就用到我们的互斥锁了。。。
1 from multiprocessing import Process,Lock 2 3 import time 4 import random 5 mutex=Lock() 6 7 def task1(lock) 8 lock.acquire() 9 print('姓名:ygg‘) 10 11 print('年龄:18‘) 12 13 def task2(lock) 14 lock.acquire() 15 print('姓名:wgg‘) 16 17 print('年龄:28‘) 18 19 def task3(lock) 20 lock.acquire() 21 print('姓名:lgg‘) 22 23 print('年龄:38‘) 24 25 if __name__="__main__": 26 p1=Process(target=task1,args=(mutex,)) 27 p2=Process(target=task2,args=(mutex,)) 28 29 p3= Process(target=task3,args=(mutex,)) 30 31 32 33 p1.start() 34 p1.start() 35 p1.start()
1 from multiprocessing import Process,Lock 2 3 4 import time 5 import random 6 mutex=Lock() 7 def task1(lock): 8 lock.acquire() 9 print('姓名: egon') 10 time.sleep(random.randint(1,3)) 11 print('年龄:18') 12 time.sleep(random.randint(1, 3)) 13 lock.release() 14 def task2(lock): 15 lock.acquire() 16 print('姓名: lxx') 17 time.sleep(random.randint(1, 3)) 18 print('年龄:20') 19 time.sleep(random.randint(1, 3)) 20 lock.release() 21 def task3(lock): 22 lock.acquire() 23 print('姓名: alex') 24 time.sleep(random.randint(1, 3)) 25 print('年龄:19') 26 time.sleep(random.randint(1, 3)) 27 lock.release() 28 29 30 if __name__ == '__main__': 31 p1=Process(target=task1,args=(mutex,)) 32 p2= Process(target=task2,args=(mutex,)) 33 p3= Process(target=task3,args=(mutex,)) 34 35 p1.start() 36 37 p2.start() 38 39 p3.start()
强调:必须是lock.acquire()一次,然后 lock.release()释放一次,才能继续lock.acquire(),不能连续的lock.acquire()
互斥锁vs join的区别一:
前提:二者的原理都是一样,都是将并发变成串行,从而保证有序区别:join是按照人为指定的顺序执行,而互斥锁是所以进程平等地竞争,谁先抢到谁执行
模拟抢票系统:
1 from multiprocessing import Process,Lock 2 import os 3 import json 4 import time 5 import random 6 mutex=Lock() 7 8 def search(): 9 with open('db.json','r',encoding='utf-8')as f: 10 dic=json.load(f) 11 12 print('%s余票为:%s'%(os.getpid(),dic['count'])) 13 14 15 def get(): 16 with open('db.json','r',encoding='utf-8') as f: 17 dic=json.load(f) 18 if dic['count'] > 0: 19 dic['count']-=1 20 time.sleep(random.randint(1,3)) 21 with open('db.json','w',encoding='utf-8') as f: 22 json.dump(dic,f) 23 print('%s 购票成功' %os.getpid()) 24 25 def task(lock): 26 search() 27 lock.acquire() 28 get() 29 lock.release() 30 31 if __name__ == '__main__': 32 for i in range(10): 33 p=Process(target=task,args=(mutex,)) 34 p.start()
#加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,即串行的修改,没错,速度是慢了,但牺牲了速度却保证了数据安全。
虽然可以用文件共享数据实现进程间通信,但问题是:
1.效率低(共享数据基于文件,而文件是硬盘上的数据)
2.需要自己加锁处理
#因此我们最好找寻一种解决方案能够兼顾:1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。这就是mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。
1 队列和管道都是将数据存放于内存中
2 队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来,
我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问题,而且在进程数目增多时,往往可以获得更好的可获展性。
队列(推荐使用)
进程彼此之间互相隔离,要实现进程间通信(IPC),multiprocessing模块支持两种形式:队列和管道,这两种方式都是使用消息传递的
创建队列的类(底层就是以管道和锁定的方式实现):
1 Queue([maxsize]):创建共享的进程队列,Queue是多进程安全的队列,可以使用Queue实现多进程之间的数据传递。
参数介绍:
1 maxsize是队列中允许最大项数,省略则无大小限制。
方法介绍:
1 q.put方法用以插入数据到队列中,put方法还有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,该方法会阻塞timeout指定的时间,直到该队列有剩余的空间。如果超时,会抛出Queue.Full异常。如果blocked为False,但该Queue已满,会立即抛出Queue.Full异常。 2 q.get方法可以从队列读取并且删除一个元素。同样,get方法有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,那么在等待时间内没有取到任何元素,会抛出Queue.Empty异常。如果blocked为False,有两种情况存在,如果Queue有一个值可用,则立即返回该值,否则,如果队列为空,则立即抛出Queue.Empty异常. 3 4 q.get_nowait():同q.get(False) 5 q.put_nowait():同q.put(False) 6 7 q.empty():调用此方法时q为空则返回True,该结果不可靠,比如在返回True的过程中,如果队列中又加入了项目。 8 q.full():调用此方法时q已满则返回True,该结果不可靠,比如在返回True的过程中,如果队列中的项目被取走。 9 q.qsize():返回队列中目前项目的正确数量,结果也不可靠,理由同q.empty()和q.full()一样
生产者消费者模型
在并发编程中使用生产者和消费者模式能够解决绝大多数并发问题。该模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度。
为什么要使用生产者和消费者模式
在线程世界里,生产者就是生产数据的线程,消费者就是消费数据的线程。在多线程开发当中,如果生产者处理速度很快,而消费者处理速度很慢,那么生产者就必须等待消费者处理完,才能继续生产数据。同样的道理,如果消费者的处理能力大于生产者,那么消费者就必须等待生产者。为了解决这个问题于是引入了生产者和消费者模式。
什么是生产者消费者模式
生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通讯,而通过阻塞队列来进行通讯,所以生产者生产完数据之后不用等待消费者处理,直接扔给阻塞队列,消费者不找生产者要数据,而是直接从阻塞队列里取,阻塞队列就相当于一个缓冲区,平衡了生产者和消费者的处理能力。
基于队列实现生产者消费者模型
import time,random,os
def consumer(q): while True:
res=q.get()
time.sleep(random.randint(1,3))
print('\033[45m%s 吃 %s\033[0m' %(os.getpid(),res))
def producer(q):
for i in range(10):
time.sleep(random.randint(1,3))
res='包子%s' %i
q.put(res)
print('\033[44m%s 生产了 %s\033[0m' %(os.getpid(),res))
if __name__ == '__main__':
q=Queue()
#生产者们:即厨师们
p1=Process(target=producer,args=(q,))
#消费者们:即吃货们
c1=Process(target=consumer,args=(q,))
#开始
p1.start()
c1.start()
print('主')
#生产者消费者模型总结 #程序中有两类角色 一类负责生产数据(生产者) 一类负责处理数据(消费者) #引入生产者消费者模型为了解决的问题是: 平衡生产者与消费者之间的工作能力,从而提高程序整体处理数据的速度 #如何实现: 生产者<-->队列<——>消费者 #生产者消费者模型实现类程序的解耦和
#生产者消费者模型总结
#程序中有两类角色
一类负责生产数据(生产者)
一类负责处理数据(消费者)
#引入生产者消费者模型为了解决的问题是:
平衡生产者与消费者之间的工作能力,从而提高程序整体处理数据的速度
#如何实现:
生产者<-->队列<——>消费者
#生产者消费者模型实现类程序的解耦和
出死循环
from multiprocessing import Process,Queue import time,random,os def consumer(q): while True: res=q.get() if res is None:break #收到结束信号则结束 time.sleep(random.randint(1,3)) print('\033[45m%s 吃 %s\033[0m' %(os.getpid(),res)) def producer(q): for i in range(10): time.sleep(random.randint(1,3)) res='包子%s' %i q.put(res) print('\033[44m%s 生产了 %s\033[0m' %(os.getpid(),res)) q.put(None) #发送结束信号 if __name__ == '__main__': q=Queue() #生产者们:即厨师们 p1=Process(target=producer,args=(q,)) #消费者们:即吃货们 c1=Process(target=consumer,args=(q,)) #开始 p1.start() c1.start() print('主')
注意:结束信号None,不一定要由生产者发,主进程里同样可以发,但主进程需要等生产者结束后才应该发送该信号
from multiprocessing import Process,Queue import time,random,os def consumer(q): while True: res=q.get() if res is None:break #收到结束信号则结束 time.sleep(random.randint(1,3)) print('\033[45m%s 吃 %s\033[0m' %(os.getpid(),res)) def producer(q): for i in range(2): time.sleep(random.randint(1,3)) res='包子%s' %i q.put(res) print('\033[44m%s 生产了 %s\033[0m' %(os.getpid(),res)) if __name__ == '__main__': q=Queue() #生产者们:即厨师们 p1=Process(target=producer,args=(q,)) #消费者们:即吃货们 c1=Process(target=consumer,args=(q,)) #开始 p1.start() c1.start() p1.join() q.put(None) #发送结束信号 print('主')
但上述解决方式,在有多个生产者和多个消费者时,我们则需要用一个很low的方式去解决
from multiprocessing import Process,Queue import time,random,os def consumer(q): while True: res=q.get() if res is None:break #收到结束信号则结束 time.sleep(random.randint(1,3)) print('\033[45m%s 吃 %s\033[0m' %(os.getpid(),res)) def producer(name,q): for i in range(2): time.sleep(random.randint(1,3)) res='%s%s' %(name,i) q.put(res) print('\033[44m%s 生产了 %s\033[0m' %(os.getpid(),res)) if __name__ == '__main__': q=Queue() #生产者们:即厨师们 p1=Process(target=producer,args=('包子',q)) p2=Process(target=producer,args=('骨头',q)) p3=Process(target=producer,args=('泔水',q)) #消费者们:即吃货们 c1=Process(target=consumer,args=(q,)) c2=Process(target=consumer,args=(q,)) #开始 p1.start() p2.start() p3.start() c1.start() p1.join() #必须保证生产者全部生产完毕,才应该发送结束信号 p2.join() p3.join() q.put(None) #有几个消费者就应该发送几次结束信号None q.put(None) #发送结束信号 print('主')
其实我们的思路无非是发送结束信号而已,有另外一种队列提供了这种机制
#JoinableQueue([maxsize]):这就像是一个Queue对象,但队列允许项目的使用者通知生成者项目已经被成功处理。通知进程是使用共享的信号和条件变量来实现的。 #参数介绍: maxsize是队列中允许最大项数,省略则无大小限制。 #方法介绍: JoinableQueue的实例p除了与Queue对象相同的方法之外还具有: q.task_done():使用者使用此方法发出信号,表示q.get()的返回项目已经被处理。如果调用此方法的次数大于从队列中删除项目的数量,将引发ValueError异常 q.join():生产者调用此方法进行阻塞,直到队列中所有的项目均被处理。阻塞将持续到队列中的每个项目均调用q.task_done()方法为止
1 import time 2 import random 3 from multiprocessing import Process,JoinableQueue 4 5 def consumer(name,q): 6 while True: 7 res=q.get() 8 if res is None:break 9 time.sleep(random.randint(1,3)) 10 print('\033[46m消费者===》%s 吃了 %s\033[0m' %(name,res)) 11 q.task_done() 12 13 def producer(name,q,food): 14 for i in range(5): 15 time.sleep(random.randint(1,2)) 16 res='%s%s' %(food,i) 17 q.put(res) 18 print('\033[45m生产者者===》%s 生产了 %s\033[0m' %(name,res)) 19 20 21 22 if __name__ == '__main__': 23 #1、共享的盆 24 q=JoinableQueue() 25 26 27 #2、生产者们 28 p1=Process(target=producer,args=('egon',q,'包子')) 29 p2=Process(target=producer,args=('刘清政',q,'泔水')) 30 p3=Process(target=producer,args=('杨军',q,'米饭')) 31 32 #3、消费者们 33 c1=Process(target=consumer,args=('alex',q)) 34 c2=Process(target=consumer,args=('梁书东',q)) 35 c1.daemon=True 36 c2.daemon=True 37 38 p1.start() 39 p2.start() 40 p3.start() 41 c1.start() 42 c2.start() 43 44 45 # 确定生产者确确实实已经生产完毕 46 p1.join() 47 p2.join() 48 p3.join() 49 # 在生产者生产完毕后,拿到队列中元素的总个数,然后直到元素总数变为0,q.join()这一行代码才算运行完毕 50 q.join() 51 #q.join()一旦结束就意味着队列确实被取空,消费者已经确确实实把数据都取干净了 52 print('主进程结束')