Python的并行任务（进程池、线程池）

六月闻君

已于 2024-08-06 16:44:10 修改

阅读量2k

点赞数 13

分类专栏： Python 优化文章标签： python

于 2024-08-05 19:57:48 首次发布

本文链接：https://blog.csdn.net/qq_39065491/article/details/140935227

版权

python的并行任务（进程池、线程池）

在Python中，进程（Process）和线程（Thread）是并发编程的两种主要方式，它们各自适用于不同的场景。了解何时使用进程或线程，可以帮助你更有效地设计并发程序。
使用内置基本库concurrent.futures来实现并发，简单使用这个模块，包括并行线程和并行进程执行器。

进程（Process）适用场景：

CPU密集型任务：当任务主要是计算密集型时，使用进程通常比线程更有效。因为Python的全局解释器锁（GIL）限制了同一时刻只有一个线程可以执行Python字节码。对于CPU密集型任务，使用多进程可以绕过GIL的限制，充分利用多核CPU的计算能力。
需要隔离的应用：如果程序的不同部分需要高度的隔离性（例如，不同的内存空间、文件描述符等），使用进程是更好的选择。进程之间的通信（IPC）虽然比线程间通信（如共享内存）复杂，但提供了更高的安全性。
跨平台兼容性：虽然Python的线程在大多数平台上都能很好地工作，但在某些平台上（特别是Windows），线程的行为可能与预期不同。在这些情况下，使用进程可能是一个更可靠的解决方案。

线程（Thread）适用场景：

I/O密集型任务：当任务主要是等待I/O操作（如文件读写、网络请求等）完成时，使用线程是更合适的选择。因为线程之间的切换成本较低，可以更有效地利用等待时间。
需要快速响应的应用：对于需要快速响应用户输入或网络请求的应用，使用线程可以更快地处理这些请求，因为线程之间的切换比进程快得多。
共享数据：如果多个任务需要频繁地访问和修改共享数据，使用线程可能更方便，因为线程可以共享进程的内存空间。然而，这也需要小心处理数据同步和竞争条件的问题。

注意：

全局解释器锁（GIL）：Python的GIL限制了同一时刻只有一个线程可以执行Python字节码。这意味着，对于CPU密集型任务，使用多线程可能不会带来性能上的提升。然而，对于I/O密集型任务，多线程仍然可以显著提高程序的效率。
线程和进程的选择：在选择使用线程还是进程时，需要综合考虑任务的性质、系统的资源以及程序的复杂度。对于简单的I/O密集型任务，线程可能是更好的选择；而对于复杂的、需要高度隔离的或CPU密集型任务，进程可能更合适。
并发库：Python提供了多种并发编程的库，如threading（用于线程）、multiprocessing（用于进程）以及concurrent.futures（提供了更高级的并发执行框架）。你可以根据具体需求选择合适的库来实现你的并发程序。

1. 并行线程ThreadPoolExecutor

import concurrent.futures
import numpy as np  
import time  

# 定义矩阵计算  
def complex_matrix_operation(n, iterations):  
    """  
    执行复杂矩阵运算来测试CPU性能。  
      
    参数:  
    n (int): 矩阵的大小，即n x n的矩阵。  
    iterations (int): 重复矩阵运算的次数。  
      
    返回:  
    float: 最终矩阵的迹（对角线元素之和）。  
    """  
    # 初始化随机矩阵  
    A = np.random.rand(n, n)  
    B = np.random.rand(n, n)  
      
    # 开始计时  
    start_time = time.time()  
      
    # 执行多次矩阵乘法  
    result = np.eye(n)  # 初始化为对角线矩阵  
    for _ in range(iterations): 
        # 矩阵乘积
        result = np.dot(result, np.dot(A, B))  
      
    # 计算并返回迹  
    trace = np.trace(result)  
      
    # 结束计时  
    end_time = time.time()  
    print(f"计算完成 {n}，耗时: {end_

最低0.47元/天解锁文章