Python爬虫学习1----单线程和多线程访问网页比较

爬虫是I/O密集型操作,在请求网页源代码时,使用多线程可以大大提高爬虫的运行效率。

例子

import requests
import time
from multiprocessing.dummy import Pool

def query(url):
    requests.get(url)

start = time.time()
for i in range(100):
    query('https://www.baidu.com/')
end = time.time()
print(f'单线程访问100次百度,耗时:{end - start}')

url_list = []
start = time.time()
for i in range(100):
    url_list.append('https://www.baidu.com/')
pool = Pool(5)
pool.map(query,url_list)
end = time.time()
print(f'5线程访问100次百度,耗时:{end - start}')

结果

5个线程耗时是单线程的五分之一多一点,这多出的一点其实是线程切换的时间,侧面反映了Python的多线程在微观上还是串行的,因此,如果线程池设置的过大,线程切换的开销可能会抵消多线程带来的性能提升,线程池的大小需要根据实际情况决定。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值