python积累:线程池ThreadPoolExecutor 的用法

前言

从Python3.2开始,标准库为我们提供了 concurrent.futures 模块,它提供了 ThreadPoolExecutor (线程池)和ProcessPoolExecutor (进程池)两个类。

相比 threading 等模块,该模块通过 submit 返回的是一个 future 对象,它是一个未来可期的对象,通过它可以获悉线程的状态主线程(或进程)中可以获取某一个线程(进程)执行的状态或者某一个任务执行的状态及返回值:

主线程可以获取某一个线程(或者任务的)的状态,以及返回值。
当一个线程完成的时候,主线程能够立即知道。
让多线程和多进程的编码接口一致。

线程池的基本使用

使用 with 语句 ,通过 ThreadPoolExecutor 构造实例,同时传入 max_workers 参数来设置线程池中最多能同时运行的线程数目。

使用 submit 函数来提交线程需要执行的任务到线程池中,并返回该任务的句柄(类似于文件、画图),注意 submit() 不是阻塞的,而是立即返回。

通过使用 done() 方法判断该任务是否结束。上面的例子可以看出,提交任务后立即判断任务状态,显示四个任务都未完成。在延时2.5后,task1 和 task2 执行完毕,task3 仍在执行中。

使用 result() 方法可以获取任务的返回值。

主要方法:

wait

 wait(fs, timeout=None, return_when=ALL_COMPLETED)

wait 接受三个参数:
fs: 表示需要执行的序列
timeout: 等待的最大时间,如果超过这个时间即使线程未执行完成也将返回
return_when:表示wait返回结果的条件,默认为 ALL_COMPLETED 全部执行完成再返回

as_completed

# as_completed源码
def as_completed(fs, timeout=None):
    ...
    fs = set(fs)  # 去重操作
    ...

ThreadPoolExecutorThreadPoolExecutor 中 的 as_completed() 当子线程中的任务执行完后,直接用 result() 获取返回结果
as_completed() 方法是一个生成器,在没有任务完成的时候,会一直阻塞,除非设置了 timeout。
当有某个任务完成的时候,会 yield 这个任务,就能执行 for 循环下面的语句,然后继续阻塞住,循环到所有的任务结束。同时,先完成的任务会先返回给主线程。

map

map(fn, *iterables, timeout=None)

fn: 第一个参数 fn 是需要线程执行的函数;
iterables:第二个参数接受一个可迭代对象;
timeout: 第三个参数 timeout 跟 wait() 的 timeout 一样,但由于 map 是返回线程执行的结果,如果 timeout小于线程执行时间会抛异常 TimeoutError。
使用 map 方法,无需提前使用 submit 方法,map 方法与 python 高阶函数 map 的含义相同,都是将序列中的每个元素都执行同一个函数。

Python 提供了强大的并发处理能力,其中 `concurrent.futures` 模块是实现多线程和多进程编程的重要工具之一。线程池ThreadPoolExecutor)是 `concurrent.futures` 中的一个核心组件,它可以帮助管理一组可重用的工作线程,提高执行效率和资源利用率。 线程池的基本用法包括以下几个步骤: 1. **导入模块**: ```python from concurrent.futures import ThreadPoolExecutor ``` 2. **创建线程池**: ```python with ThreadPoolExecutor(max_workers=5) as executor: # max_workers设定线程数量 future_list = [] ``` `max_workers` 参数设置线程池中最多可以同时执行的任务数。 3. **提交任务**: ```python for task in tasks: # tasks是一个包含待执行函数的任务列表 future = executor.submit(task) future_list.append(future) ``` `submit` 函数将任务提交给线程池,返回一个 `Future` 对象,代表异步操作的结果。 4. **等待任务完成并获取结果**: ```python for future in concurrent.futures.as_completed(future_list): try: result = future.result() print(f"Task {future} completed with result: {result}") except Exception as exc: print(f"Exception: {exc}") ``` `as_completed` 函数会按完成顺序返回 `Future` 对象,我们可以通过 `result()` 获取实际的结果。 线程池的优点包括: - 避免频繁创建和销毁线程,提高了效率 - 内部有线程管理和调度机制,可以自动调整任务的执行顺序 - 可以限制并行度,防止过多的线程导致系统资源消耗过大 然而,需要注意的是,线程池并不适合I/O密集型任务,因为线程之间的切换开销较大。对于这类任务,`asyncio` 库通常更合适。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值