概念
在并发编程中使用生产者和消费者模式能够解决绝大多数并发问题。该模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度。
生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通讯,而通过阻塞队列来进行通讯,所以生产者生产完数据之后不用等待消费者处理,
直接扔给阻塞队列,消费者不找生产者要数据,而是直接从阻塞队列里取,阻塞队列就相当于一个缓冲区,平衡了生产者和消费者的处理能力。
为什么要使用生产者和消费者模式
在线程世界里,生产者就是生产数据的线程,消费者就是消费数据的线程。在多线程开发当中,如果生产者处理速度很快,而消费者处理速度很慢,
那么生产者就必须等待消费者处理完,才能继续生产数据。同样的道理,如果消费者的处理能力大于生产者,那么消费者就必须等待生产者。为了解决这个问题于是引入了生产者和消费者模式。
基于队列实现生产者消费者模型
产生原因及解决办法
原因是:生产者p在生产完后就结束了,但是消费者c在取空了q之后,则一直处于死循环中且卡在q.get()这一步。
解决方式:
普通方法:无非是让生产者在生产完毕后,往队列中再发一个结束信号,这样消费者在接收到结束信号后就可以break出死循环
JoinableQueue 方法: 生产者生产的每个数据上都做一个标记,消费者每 q.get() 取一个值,都用 q.task_done() 标记一次,q.join()感知队列中的数据全部处理完毕,再最终结束
from multiprocessing import Process, Queue
import time
import random
# 生产者
def producer(name, food, q):
for i in range(5):
data = '%s生产%s%s'%(name, food, i+1)
time.sleep(random.random())
q.put(data)
print(data)
# 消费者
def consumer(name, q):
while True:
data = q.get() # 程序停在此处
if data == None:break
print('%s吃了%s'%(name, data))
time.sleep(random.random())
if __name__ == '__main__':
q = Queue()
p1 = Process(target=producer, args=('小明', '包子', q))
p2 = Process(target=producer, args=('小刘', '馒头', q))
c1 = Process(target=consumer, args=('哈哈',q))
c2 = Process(target=consumer, args=('嘻嘻',q))
p1.start()
p2.start()
c1.start()
c2.start()
# 此时 生产者已经不再生产数据,但消费者还在取数据,卡在data = q.get()
# 解决办法 在生产者在生产完毕后,往队列中再发一个结束信号,这样消费者在接收到结束信号后就可以break出死循环
p1.join()
p2.join()
q.put(None)
q.put(None) # 有两个消费者
JoinableQueue 模块
JoinableQueue([maxsize]):这就像是一个Queue对象,但队列允许项目的使用者通知生成者项目已经被成功处理。通知进程是使用共享的信号和条件变量来实现的。
#方法介绍:
- JoinableQueue的实例p除了与Queue对象相同的方法之外还具有:
- q.task_done():使用者使用此方法发出信号,表示q.get()的返回项目已经被处理。如果调用此方法的次数大于从队列中删除项目的数量,将引发ValueError异常
- q.join():生产者调用此方法进行阻塞,直到队列中所有的项目均被处理。阻塞将持续到队列中的每个项目均调用q.task_done()方法为止
from multiprocessing import Process, JoinableQueue
import time
import random
# 生产者
def producer(name, food, q):
for i in range(5):
data = '%s生产%s%s' % (name, food, i + 1)
time.sleep(random.random())
q.put(data)
print(data)
# 消费者
def consumer(name, q):
while True:
data = q.get() # 程序停在此处
if data == None: break
print('%s吃了%s' % (name, data))
time.sleep(random.random())
q.task_done()
if __name__ == '__main__':
q = JoinableQueue()
p1 = Process(target=producer, args=('小明', '包子', q))
p2 = Process(target=producer, args=('小刘', '馒头', q))
c1 = Process(target=consumer, args=('哈哈', q))
c2 = Process(target=consumer, args=('嘻嘻', q))
p1.start()
p2.start()
c1.daemon = True
c2.daemon = True
c1.start()
c2.start()
# 此时 生产者已经不再生产数据,但消费者还在取数据,卡在data = q.get()
# 解决办法 在生产者在生产完毕后,往队列中再发一个结束信号,这样消费者在接收到结束信号后就可以break出死循环
p1.join()
p2.join()
q.join() # 等到队列中的数据全取出
总结:
程序中有两类角色
一类负责生产数据(生产者)
一类负责处理数据(消费者)
引入生产者消费者模型为了解决的问题是:
平衡生产者与消费者之间的工作能力,从而提高程序整体处理数据的速度
如何实现:
生产者<-->队列<——>消费者