Python 多线程使用指南

油头Y7

已于 2024-05-17 17:38:39 修改

阅读量408

点赞数 5

文章标签： python

于 2024-05-17 17:34:36 首次发布

本文链接：https://blog.csdn.net/sbdd6556/article/details/139010023

版权

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

引言

Python的concurrent.futures模块提供了一个ThreadPoolExecutor类，它可以创建一个线程池来并发地执行多个任务。这个指南将帮助您理解如何使用ThreadPoolExecutor来加速程序的执行。

安装

Python 3.2及之后的版本自带concurrent.futures模块，无需额外安装。只需使用import语句即可使用。

使用线程池执行器 ThreadPoolExecutor
创建线程池

from concurrent.futures import ThreadPoolExecutor

用指定的线程数初始化 ThreadPoolExecutor

executor = ThreadPoolExecutor(max_workers=10)

max_workers是线程池中的线程数，通常取决于您的任务类型和系统的硬件资源。

提交任务

使用submit方法

submit()方法用于提交一个可调用对象以及它的参数到线程池。这会返回一个Future对象，代表异步执行的操作。

future = executor.submit(a_function, arg1, arg2)

使用map方法

map()方法用于同时提交多个任务到线程池，它会对各个任务的参数进行迭代。当迭代的对象提供了多个序列时，它们会并行地进行。

results = executor.map(a_function, iterable1, iterable2)

关闭线程池

可以使用with语句来自动管理线程池的生命周期：

with ThreadPoolExecutor(max_workers=10) as executor:
    # 在这个代码块中提交任务
    # ...

退出with代码块时，线程池自动关闭

如果不使用with语句，需要手动调用shutdown()方法：

executor.shutdown(wait=True)

wait参数表示是否等待所有线程完成任务。当设置为True，shutdown()会等待所有提交给线程池的未完成任务结束。

示例代码

以下是一个提交给线程池的任务的简单例子：

import concurrent.futures

def load_url(url, timeout):
    # 这里是加载网页的代码
    return url

urls = ["http://google.com", "http://example.com"] # 要加载的网页列表

with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
    # 提交网页加载任务
    future_to_url = {executor.submit(load_url, url, 60): url for url in urls}

    # 等待任务完成并获取结果
    for future in concurrent.futures.as_completed(future_to_url):
        url = future_to_url[future]
        try:
            data = future.result()
        except Exception as exc:
            print('%r generated an exception: %s' % (url, exc))
        else:
            print('%r page is %d bytes' % (url, len(data)))

示例二

from concurrent.futures import ThreadPoolExecutor

def scrape_and_save_data(url, table_name, proxies):
	pass

def wrapper(url, table_name): 
	scrape_and_save_data(url, table_name, proxies)

with ThreadPoolExecutor(max_workers=NUM_WORKERS) as executor:
	executor.map(wrapper, urls.keys(), urls.values())