Python 队列 get()/task_done() 问题

潮易

于 2024-08-30 23:37:58 发布

阅读量293

点赞数 4

文章标签： python 开发语言

本文链接：https://blog.csdn.net/wangbadan121/article/details/141729800

版权

在Python中，`queue.get()` 和 `queue.task_done()` 方法用于实现多线程或多进程编程中的任务队列（Queue）。它们之间的交互是至关重要的。当一个任务完成并需要从队列中移除时，应该调用 `task_done()` 方法来通知队列该任务已完成。如果队列在等待任务的过程中被阻塞，那么可以调用 `get(timeout=None)` 来获取任务。

### 基本使用示例：
```python
import queue
import threading

# 创建一个队列
q = queue.Queue()

# 定义一个函数来模拟处理任务的线程
def worker():
    while True:
        item = q.get() # 获取任务，如果队列为空会阻塞直到有新任务
        print(f'Processing item: {item}')
        q.task_done()   # 通知队列完成这个任务

# 创建并启动工作线程
threads = [threading.Thread(target=worker) for _ in range(5)]
for t in threads:
t.start()

# 向队列中添加一些任务
for i in range(10):
q.put(i)

# 等待所有任务完成
q.join() # 这里会阻塞，直到队列为空

# 关闭线程
for t in threads:
t.join()
```

### 注意事项：
- `task_done()` 方法必须与 `get()` 配合使用。当你从队列中获取一个任务后，应该调用这个方法来通知队列这个任务已完成。否则，队列会一直阻塞等待新的任务。
- 如果想要在指定时间内（例如10秒）从队列中获取任务，可以使用 `q.get(timeout=10)`。这样如果10秒内没有任务，`get()` 方法就会抛出 `queue.Empty` 异常。

### 测试用例：
```python
import unittest
from queue import Queue
from threading import Thread

class TestQueueMethods(unittest.TestCase):
    def test_task_done(self):
        q = Queue()
        for i in range(10):
            q.put(i)
        threads = [Thread(target=lambda: q.get()) for _ in range(5)]
        [t.start() for t in threads]
        # 确保队列中有任务，否则wait会阻塞
        self.assertNotEqual(0, q.qsize())
        for _ in range(5): # 模拟工作线程完成5个任务
            q.task_done()
        q.join() # 等待所有任务完成
        self.assertEqual(0, q.qsize())

if __name__ == '__main__':
unittest.main()
```

### AI大模型应用场景：
在AI大模型中，如深度学习、自然语言处理等任务中，我们常常需要将大量数据输入到机器学习模型中进行训练。这时，我们可以使用队列来并行处理这些数据，提高效率。例如，在图像识别任务中，我们可以创建一个队列来收集待处理的图片，然后将每张图片作为任务放入队列中，多个线程或进程分别从队列中取出任务并进行处理。当处理完一张图片后，调用 `task_done()` 通知队列该任务已完成，队列会自动移除这个任务。