python多线程介绍

每个库或模块都有其特定的用途和优势,选择哪一个取决于具体的任务需求、计算资源。一般可以将任务分成两类:

  • I/O 密集型任务:这些任务的瓶颈主要在于等待外部操作,如磁盘读写或网络通信。在这些等待期间,CPU 大部分时间是空闲的。线程由于其轻量级特性,适合于这种等待较多的任务。当一个线程等待 I/O 操作完成时,操作系统可以切换到另一个线程继续工作,从而更有效地利用 CPU。比如爬虫就是io密集

  • CPU 密集型任务:这些任务主要涉及大量的计算,CPU 持续处于忙碌状态。在这种情况下,使用多线程可能不会带来明显的性能提升,因为线程共享相同的 CPU 核心。相反,多进程可以在多核心处理器上并行执行,每个进程在不同的核心上运行,从而更有效地利用 CPU 资源。

  1. 线程ThreadPoolExecutor (concurrent.futures 模块):

    • 用途: 主要用于 I/O 密集型任务,如文件读写、网络请求等。
    • 工作原理: 使用线程池执行并发任务。由于 GIL(全局解释器锁(在 CPython 解释器中限制了同时只能有一个线程执行 Python 字节码))的存在,它不适合 CPU 密集型任务。(线程在执行 Python 代码时仍然是顺序执行。而多进程可以绕过 GIL 的限制,因为每个进程有自己的解释器和内存空间)
    • 优点: 线程切换开销小于进程切换,适用于多个较小的、阻塞式任务。
  2. 进程ProcessPoolExecutor (concurrent.futures 模块):

    • 用途: 适用于 CPU 密集型任务,如复杂计算、数据处理等。
    • 工作原理: 使用进程池执行并发任务,每个进程运行在其独立的内存空间内。
    • 优点: 避开 GIL 限制,可以充分利用多核 CPU。
  3. multiprocessing 模块:

    • 用途: 与 ProcessPoolExecutor 类似,用于 CPU 密集型任务。
    • 工作原理: 创建多个进程,每个进程都在自己的 Python 解释器内运行。
    • 特点: 提供了更丰富的进程间通信(IPC)工具,如管道、队列等。
  4. threading 模块:

    • 用途: 用于多线程编程,适合 I/O 密集型任务。
    • 特点: 相比于 ThreadPoolExecutor 提供了更底层的线程操作。
  5. asyncio 模块:

    • 用途: 用于编写单线程并发的异步 I/O 操作,适合高 I/O 等待的应用,如大量网络请求、高并发 Web 应用。
    • 特点: 通过事件循环和协程提供非阻塞操作。
  6. gunicorn + gevent:

    • 用途: 主要用于网络应用,特别是在 Python Web 框架中。
    • 工作原理: gevent 提供异步操作,而 gunicorn 作为一个 WSGI HTTP 服务器。
  7. Celery:

    • 用途: 用于异步任务队列/作业队列,特别适合需要执行长时间运行任务的应用。
    • 特点: 支持多种消息代理(如 RabbitMQ、Redis)作为任务队列。
  8. Dask:

    • 用途: 用于大规模数据处理,尤其是超出内存大小的数据集。
    • 特点: 提供并行数据处理,与 Pandas、NumPy、Scikit-Learn 等库良好集成。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坠金

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值