python中multiprocessing模块

multiprocess模块那来干嘛的?

答:利用multiprocessing可以在主进程中创建子进程。Threading是多线程,multiprocessing是多进程。

#该模块和Threading模块使用方法基本类似。

  • 首先需要说明,你所使用多线程的函数不能有return,比如你要将job这个函数多线程那么在job这个函数里就不能有return,如果有返回值请看文章。
  • multiprocessing最好写在if __name__ == '__main__'当中,如果不放在这里面,windows可能会出错。其余环境则不会出现这种情况。我第一个案例没有加,第二个案例加了。

案例:

 1 #!usr/bin/env python
 2 #encding:utf-8
 3 #by i3ekr
 4 
 5 import multiprocessing,time
 6 
 7 def job(q,a):#将Queue当参数传入,且必须放在首位。
 8     time.sleep(3)
 9     print 'this is test...%s'%(a)
10 
11 
12 start = time.time()
13 q = multiprocessing.Queue()#定义一个Queue,这个Queue是必须的。
14 p1 = multiprocessing.Process(target=job,args=(q,1))#创建一个线程,第一个q是Queue,第二个是参数的value。如果没有参数的话必须要(q,)逗号是必须要加的
15 p2 = multiprocessing.Process(target=job,args=(q,2))
16 p1.start()
17 p2.start()
18 p1.join()
19 p2.join()
20 end = time.time()
21 print("run time is %s"%(end-start))

输出结果:

root@i3ekr:/home/i3ekr/Desktop# python 1.py 
this is test...1
this is test...2
run time is 3.0163371563


 那么函数有返回值的时候怎么做?

使用队列.put()进行保存值。使用get得到返回值。如下案例所示:

需要注意得是:

  • 有多少个返回值就要有多少个get。并不是一下子把所有得返回值全都一起输出之类得。如下代码20-21行,因为有两个线程,所以执行了两遍job函数,所以也有两个返回值。故也必须要有两个get去得到value
 1 #!usr/bin/env python
 2 #encding:utf-8
 3 #by i3ekr
 4 
 5 import multiprocessing,time
 6 
 7 def job(q,a):
 8     time.sleep(3)
 9     q.put(a)#得到a
10 
11 
12 if __name__ == '__main__':
13     start = time.time()
14     q = multiprocessing.Queue()
15     p1 = multiprocessing.Process(target=job,args=(q,1))
16     p2 = multiprocessing.Process(target=job,args=(q,2))
17     p1.start()
18     p2.start()
19     p1.join()
20     p2.join()
21     res1 = q.get()#得到job得返回值
22     res2 = q.get()
23     print res1,res2
24     end = time.time()
25     print("run time is %s"%(end-start))

输出结果:

root@i3ekr:/home/i3ekr/Desktop# python 1.py
1 2
run time is 3.01186394691


 

当然上面那个方法不是那么友好,在python里有线程池的概念。通过线程池可以更好的解决这个问题。

线程池是什么?

  • 线程池是一种多线程处理形式,处理过程中将任务添加到队列,然后在创建线程后自动启动这些任务

线程池做法思路:

  1. 先建立一个方法(即函数)专门用来放池子。例如:def multipro():
  2. 建立线程池。例如:po = multiprocessing.Pool()
  3. 通过线程池去实现方法(就是调用需要实现的功能,job是要实现多进程得功能函数)例如:res=po.map(job,range(10))
  4. map是mulprocessing的方法。

整理得出以下代码:

 1 #!usr/bin/env python
 2 #encding:utf-8
 3 #by i3ekr
 4 
 5 import multiprocessing,time
 6 
 7 def job(a):
 8     return a*a
 9 
10 def multipro():
11     po = multiprocessing.Pool()#该处默认启用得是所有的核数,可以通过Pool(multiprocessing=3)这样去设置。
12     res=po.map(job,range(10))
13     print res
14 
15 if __name__ == '__main__':
16     multipro()

除了map还有apply_async、

使用方法:res = po.apply_async(job,(2,))

 1 #!usr/bin/env python
 2 #encding:utf-8
 3 #by i3ekr
 4 
 5 import multiprocessing,time
 6 
 7 def job(a):
 8     return a*a
 9 
10 def multipro():
11     po = multiprocessing.Pool()
12     res=po.apply_async(job,(2,))#如果是只有一个参数依旧是一个可迭代的对象,所以需要多加一个逗号。
13     print res.get()#通过get得到返回值
14 
15 if __name__ == '__main__':
16     multipro()

运行结果:

root@i3ekr:/home/i3ekr/Desktop# python 1.py
2

可以将apply_async用得更高级。做成一个迭代器。

 1 #!usr/bin/env python
 2 #encding:utf-8
 3 #by i3ekr
 4 
 5 import multiprocessing,time
 6 
 7 def job(a):
 8     return a
 9 
10 def multipro():
11     po = multiprocessing.Pool()
12     res=[po.apply_async(job,(i,)) for i in range(10)]
13     print([res.get() for res in res])#迭代res返回res给res.get
14 
15 if __name__ == '__main__':
16     multipro()

进程锁


跟Theading一样,会去抢内存。如果不了解得可以参考:http://www.cnblogs.com/xishaonian/p/7624736.html

基础知识:

  • acquire()#上锁
  • release()#解锁 

 

转载于:https://www.cnblogs.com/nul1/p/8964843.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值