python可以开多少线程_python线程数量与线程池

最新推荐文章于 2024-07-06 02:47:38 发布

weixin_39884877

最新推荐文章于 2024-07-06 02:47:38 发布

阅读量1.5k

点赞数

文章标签： python可以开多少线程

本文探讨了Python中如何使用线程进行任务处理，包括两个线程抓取10个网页的示例，线程数量试验，以及线程池的应用。实验结果显示，线程池和每次循环新建线程可以显著提高效率，特别是当线程数量适当时。文章还提到了线程数量的控制方法和Semaphore的使用。

摘要由CSDN通过智能技术生成

本文分为以下几个部分两个线程抓10个网页

线程数量试验

参考资料

线程数量控制

线程池

两个线程抓10个网页

之前我们有过循环抓取10页豆瓣电影数据的例子，当时是每次循环都新建了一个线程，但是如果我们想要只用两个线程怎么办呢？

首先声明，1个线程分5个的想法是不行的，因为每个线程运行时间带有随机性，如果任务平均分配，则很可能出现一个线程还在苦苦工作，而另一个线程已经完成，却无法帮助前一个线程分担的情况，这无疑会降低运行效率。

一个办法是维护一个队列，两个线程都从中获取任务，直到把这个队列中的任务都做完。这个过程其实就是特殊的生产消费模式，只不过没有生产者，任务量是固定的而已。

import threading

import requests

from bs4 import BeautifulSoup

from queue import Queue

class MyThread(threading.Thread):

def __init__(self, queue):

threading.Thread.__init__(self)

self.queue = queue

def run(self):

while not self.queue.empty(): # 如果while True 线程永远不会终止

url = self.queue.get()

print(self.name, url)

url_queue.task_done()

r = requests.get(url)

soup = BeautifulSoup(r.content, 'html.parser')

lis = soup.find('ol', class_='grid_view').find_all('li')

for li in lis:

title = li.find('span', class_="title").text

print(title)

url_queue = Queue()

for i in range(10):

url = 'https://movie.douban.com/top250?start={}&filter='.format(i*25)

url_queue.put(url)

th1 = MyThread(url_queue)

th2 = MyThread(url_queue)

th1.start()

th2.start()

th1.join()

th2.join()

url_queue.join()

print('finish')

这里注意几点Queue.empty()表示如果队列是空则为True，否则是Fals

最低0.47元/天解锁文章

weixin_39884877

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python可以开多少线程_python线程数量与线程池

本文分为以下几个部分两个线程抓10个网页线程数量试验参考资料线程数量控制线程池两个线程抓10个网页之前我们有过循环抓取10页豆瓣电影数据的例子，当时是每次循环都新建了一个线程，但是如果我们想要只用两个线程怎么办呢？首先声明，1个线程分5个的想法是不行的，因为每个线程运行时间带有随机性，如果任务平均分配，则很可能出现一个线程还在苦苦工作，而另一个线程已经完成，却无法帮助前一个线程分担的情况，这无疑会...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。