Python进程池pool使用方法以及map函数用法

2020重新做人于 2019-01-15 17:52:56 发布


在进行多数量的数据爬取时,我们常常需要使用多进程来实现数据爬取。这里我们来看一下python的进程池pool要怎么使用

首先当然是导入相关的库文件

  1. from multiprocessing.pool import Pool

这里我们简单的写一个函数

  1. def hhh(i):
  2.     return i * 2
  3. if __name__ == '__main__':
  4.     pool = Pool(processes=2)
  5.     hh = pool.map(hhh, [1, 2, 3])
  6.     print(hh)

这里我们看到Pool有一个processes参数,这个参数可以不设置,如果不设置函数会跟根据计算机的实际情况来决定要运行多少个进程,我们也可自己设置,但是要考虑自己计算机的性能
注意:这里的进程池pool对象定义一定放在main函数下,如果不放在这里会出现如下报错

  1.  RuntimeError: 
  2.         An attempt has been made to start a new process before the
  3.         current process has finished its bootstrapping phase.
  4.         This probably means that you are not using fork to start your
  5.         child processes and you have forgotten to use the proper idiom
  6.         in the main module:
  7.             if __name__ == '__main__':
  8.                 freeze_support()
  9.                 ...
  10.  The "freeze_support()" line can be omitted if the program
  11.         is not going to be frozen to produce an executable.

map()函数会将第二个参数的需要迭代的列表元素一个个的传入第一个参数我们的函数中,第一个参数是我们需要引用的函数,这里我们看到第一个参数我们自己定义的函数并没有设置形参传值。因为我们的map会自动将数据作为参数传进去。非常方便

 这里是我们的输出结果
————————————————
版权声明:本文为CSDN博主「2020重新做人」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_36637463/article/details/86496763

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值