学习笔记(01):Python爬虫开发-异步爬虫之线程池案例应用

本文通过实例演示了Python中使用线程池进行异步爬虫操作,展示了线程池可能导致的输出错乱问题,并给出了单线程处理任务的耗时对比,强调了异步处理的效率提升。
摘要由CSDN通过智能技术生成

立即学习:https://edu.csdn.net/course/play/24454/306796?utm_source=blogtoedu

import time
from multiprocessing.dummy import Pool

def p_str(str):
	print("处理:",str)
	time.sleep(2)
	print("处理完毕!")

def main():
	li = ["任务1","任务2","任务3","任务4","任务5"]

	# 模拟单线程串行方式进行任务处理,并检查耗耗时
	single_start_time = time.time()
	for i in range(len(li)):
		p_str(li[i])
	single_end_time = time.time()
	print("单线程处理任务总耗时:{}".format(single_end_time-single_start_time))

	print("#"*40)

	# 模拟线程池的方式进行任务处理,并检查耗时
	multi_start_time = time.time()
	# 首先,构建一个5线程池
	pool = Pool(5)
	# 通过map方法,将任务列表li中的元素传递给p_str函数进行处理
	pool.map(p_str,li)
	multi_end_time = time.time()
	print("单线程处理任务总耗时:{}".format(multi_end_time-multi_start_time))

if __name__ == '__main__':
	main()

线程池,会导致处理函数的输出结果出现错乱。

处理: 任务1
处理完毕!
处理: 任务2
处理完毕!
处理: 任务3
处理完毕!
处理: 任务4
处理完毕!
处理: 任务5
处理完毕!
单线程处理任务总耗时:-10.00244665145874
########################################
处理:处理:  任务1
处理: 任务3
任务2处理:
 处理: 任务5任务4

处理完毕!处理完毕!处理完毕!
处理完毕!
处理完毕!


单线程处理任务总耗时:-2.2071752548217773
[Finished in 12.4s]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值