Python的多进程和多线程和协程，聊聊GIL和守护概念

termiliter

已于 2023-09-20 12:09:24 修改

阅读量180

点赞数 1

文章标签： python 服务器 linux

于 2023-09-15 15:17:57 首次发布

本文链接：https://blog.csdn.net/termiliter/article/details/132902476

版权

多进程（Multiprocessing）：

多进程编程是利用多个独立的进程来执行任务，每个进程有自己独立的内存空间。Python 提供了 multiprocessing 模块来实现多进程编程。

优点：

多进程可以有效地利用多核处理器，提高并行性。
每个进程都有独立的内存空间，不会相互干扰。
适用于CPU密集型任务，如计算密集型应用程序

示例代码：

#anthor--terminator
import multiprocessing

def worker_function(number):
    result = number * 2
    print(f"Result: {result}")

if __name__ == "__main__":
    numbers = [1, 2, 3, 4, 5]
    processes = []

    for number in numbers:
        process = multiprocessing.Process(target=worker_function, args=(number,))
        processes.append(process)
        process.start()

    for process in processes:
        process.join()

多线程（Multithreading）：

多线程编程是在同一进程内创建多个线程，这些线程共享相同的内存空间，但有各自的线程栈。Python 提供了 threading 模块来实现多线程编程。

优点：

线程轻量，创建和销毁速度快。
适用于I/O密集型任务，如网络通信和文件操作。

示例代码：

#anthor--terminator
import threading

def worker_function(number):
    result = number * 2
    print(f"Result: {result}")

if __name__ == "__main__":
    numbers = [1, 2, 3, 4, 5]
    threads = []

    for number in numbers:
        thread = threading.Thread(target=worker_function, args=(number,))
        threads.append(thread)
        thread.start()

    for thread in threads:
        thread.join()

缺陷和注意事项：

无论是多进程还是多线程，在并发编程中都需要考虑一些缺陷和注意事项：

全局解释器锁（GIL）：Python 全局解释器锁限制了多线程程序的并行性，因此在 CPU 密集型任务中多线程可能不如多进程有效。
进程/线程间通信：在多进程编程中，进程间通信（IPC）通常需要使用特殊的机制（如队列或管道），而在多线程编程中，线程共享内存，但需要小心处理共享数据的同步问题。
资源管理：多进程编程涉及更多的系统资源，如内存和文件句柄，需要谨慎管理。多线程编程可能引发线程安全问题，需要合适的同步机制。
复杂性：并发编程增加了代码的复杂性，容易引入难以调试的错误，如死锁和竞态条件。
平台依赖性：多进程编程在不同操作系统上的行为可能会有所不同。多线程编程可能受到不同 Python 解释器实现的影响。

总之，多进程和多线程编程各有优点和适用场景，选择取决于任务性质和性能需求。在使用时，需要仔细考虑并发编程的复杂性和潜在问题。对于某些情况，结合多进程和多线程也可以发挥它们各自的优势。

线程池和进程池是一种用于管理并发任务执行的高级编程概念，它们可以帮助您更有效地利用多线程和多进程，而不必手动创建和管理线程或进程。以下是关于线程池和进程池的解释以及它们的使用示例：

线程池（ThreadPool）：

线程池是一组已经创建的线程，这些线程在池中等待执行任务。它们可以被重复利用来执行多个任务，而不必频繁地创建和销毁线程，从而提高了性能和资源利用率。

Python 中有一些库可以用来创建线程池，其中最常用的是 concurrent.futures 模块中的 ThreadPoolExecutor 类。以下是一个线程池的示例：

#anthor--terminator
from concurrent.futures import ThreadPoolExecutor

def worker_function(number):
    result = number * 2
    return result

if __name__ == "__main__":
    numbers = [1, 2, 3, 4, 5]

    with ThreadPoolExecutor(max_workers=3) as executor:
        results = list(executor.map(worker_function, numbers))

    print(results)

在上面的示例中，我们使用 ThreadPoolExecutor 创建了一个具有最大工作线程数为 3 的线程池，然后使用 map 方法并发地执行 worker_function 函数。

进程池（Process Pool）：

进程池与线程池类似，但是它管理的是进程而不是线程。每个进程池中的进程都可以执行任务，并且可以被重复利用。Python 中的 concurrent.futures 模块也提供了 ProcessPoolExecutor 类来创建进程池。以下是一个进程池的示例：

#anthor--terminator
from concurrent.futures import ProcessPoolExecutor

def worker_function(number):
    result = number * 2
    return result

if __name__ == "__main__":
    numbers = [1, 2, 3, 4, 5]

    with ProcessPoolExecutor(max_workers=3) as executor:
        results = list(executor.map(worker_function, numbers))

    print(results)

在上面的示例中，我们使用 ProcessPoolExecutor 创建了一个具有最大工作进程数为 3 的进程池，并使用 map 方法并发地执行 worker_function 函数。

注意事项：

线程池和进程池使并发编程更加方便，但仍然需要注意共享数据的线程安全问题，特别是对于修改共享数据的操作。
线程池适用于 I/O 密集型任务，而进程池适用于 CPU 密集型任务，因为进程之间有独立的内存空间，不受 GIL 限制。
您可以根据任务的性质和系统资源来选择线程池或进程池，以最大化性能。
使用上下文管理器 with 可以确保在使用完线程池或进程池后正确地关闭它们，释放资源。

总之，线程池和进程池是用于管理并发任务执行的强大工具，可以简化并发编程并提高性能。您可以根据具体的需求选择使用其中之一来处理多任务并发执行。

GIL(全局解释器锁)：

Python 全局解释器锁（Global Interpreter Lock，简称 GIL）是 Python 解释器中的一个关键概念，它对多线程并发执行 Python 代码产生了重要影响。以下是关于 GIL 的完整解释：

GIL 是什么：

GIL 是 Python 解释器中的一个互斥锁（Mutex），它是一种用于控制多线程之间并发访问共享资源的机制。在 CPython（Python 的标准解释器）中，GIL 用于保护 Python 对象的内存管理，确保在同一时刻只有一个线程可以执行 Python 字节码。这意味着在多线程的情况下，Python 解释器一次只能执行一个线程的代码。
为什么有 GIL：

GIL 的存在是为了解决 CPython 在多线程环境中的线程安全问题。由于 Python 的内存管理不是线程安全的，如果多个线程同时操作 Python 对象，可能会导致数据不一致或内存泄漏等问题。为了避免这些问题，CPython 引入了 GIL，以确保在任何给定时刻只有一个线程执行 Python 代码。
影响和限制：
- 多核 CPU 利用：GIL 限制了多线程 Python 程序在多核 CPU 上的并行性。因为在同一时刻只有一个线程执行 Python 代码，所以多核 CPU 无法充分利用。
- I/O 密集型任务：对于 I/O 密集型任务，GIL 并不是一个大问题，因为线程在等待 I/O 操作完成时会释放 GIL。在这种情况下，多线程仍然可以提高程序的效率，因为等待 I/O 的时间比 CPU 运算少。
- CPU 密集型任务：对于 CPU 密集型任务，GIL 成为了瓶颈，因为多线程无法在多核 CPU 上并行执行计算密集型 Python 代码。
如何避免 GIL 的限制：
- 多进程：一个常见的解决方法是使用多进程而不是多线程。每个进程都有自己独立的 Python 解释器和内存空间，因此不受 GIL 的限制。multiprocessing 模块可用于创建多进程应用程序。
- 使用其他语言库：对于 CPU 密集型任务，可以使用其他语言编写的扩展模块（如 C/C++）来绕过 GIL。
- 使用线程池和进程池：Python 3.2+ 提供了 concurrent.futures 模块，它允许您使用线程池和进程池来执行并行任务，而不需要手动管理线程和进程。

总之，GIL 是 Python 并发编程的一个重要概念，它在某些情况下会限制多线程程序的性能，特别是在 CPU 密集型任务中。因此，在选择多线程或多进程编程时，需要根据任务的性质和性能需求来权衡。对于大多数应用程序，特别是 I/O 密集型应用程序，GIL 不会成为主要问题。但对于需要最大化 CPU 利用率的应用程序，需要考虑避免 GIL 的限制。

"守护"（Daemon）：

"守护"（Daemon）是一个在计算机编程中常见的概念，它通常用于描述一种类型的进程或线程，其行为和生命周期受到其他主要进程或线程的影响。

以下是关于守护的解释和用法：

守护进程（Daemon Process）：
- 守护进程是在后台运行的进程，通常是为了执行一些系统任务或长期运行的服务而设计的。
- 守护进程通常不与用户交互，它们在系统启动时启动，并在系统关闭时终止。
- 守护进程通常不会创建终端或交互式会话，它们运行在后台，独立于用户登录会话。
- 守护进程的典型示例包括网络服务器、定期备份任务、系统监控程序等。
守护线程（Daemon Thread）：
- 守护线程是在多线程编程中的线程类型，其行为类似于守护进程。
- 当主线程或主进程退出时，守护线程会立即终止，而不管它们是否完成了任务。
- 守护线程通常用于执行后台任务，如日志记录、数据采集或定期清理。

在 Python 中，可以使用 threading 模块来创建守护线程，通过设置线程的 daemon 属性为 True 来将线程设置为守护线程。示例代码如下：

#anthor--terminator
import threading
import time

def daemon_function():
    while True:
        print("Daemon thread is running...")
        time.sleep(1)

if __name__ == "__main__":
    daemon_thread = threading.Thread(target=daemon_function)
    daemon_thread.daemon = True  # 将线程设置为守护线程
    daemon_thread.start()

    # 主线程
    time.sleep(5)
    print("Main thread is done.")

在上面的示例中，daemon_function 是一个守护线程，它将无限循环打印消息。当主线程完成后，守护线程会被立即终止，而不管它是否已完成。

总之，守护是一种用于描述在后台运行的进程或线程的概念，它们通常用于执行一些系统任务或后台服务，不需要与用户交互，并且会在主进程或主线程退出时自动终止。

协程

是一种轻量级的并发编程技术，它允许你在程序中创建异步任务并按需挂起或恢复它们的执行，而不会阻塞整个程序。在Python中，你可以使用asyncio库来创建和管理协程，而await关键字则用于挂起协程的执行，等待异步操作完成。

下面是关于asyncio和await的一些重要概念：

asyncio：asyncio是Python的一个标准库，用于编写异步代码。它提供了一种事件循环（Event Loop）模型，允许你在一个单线程中管理多个协程。通过事件循环，你可以安排协程的执行，以便它们可以异步地运行。
async和await：在定义一个协程函数时，你可以使用async关键字来标记该函数，并在函数内部使用await关键字来挂起协程的执行，等待某个异步操作的完成。当协程被挂起时，事件循环可以继续执行其他任务，从而实现并发。

展示了如何使用asyncio和await来创建和运行一个简单的协程：

import asyncio

async def main():
    print("Hello")
    await asyncio.sleep(1)  # 模拟异步操作，挂起协程执行1秒钟
    print("World")

# 创建事件循环并运行协程
loop = asyncio.get_event_loop()
loop.run_until_complete(main())
loop.close()

仓促成文，不当之处，尚请读者批评指正

------terminator