python 多线程与多进程 threading、multiprocessing
多线程:
线程是独立的处理流程,可以和系统的其他线程并行或并发地执行。多线程可以共享数据和资源,利用所谓的共享内存空间。线程和进程的具体实现取决于你要运行的操作系统,但是总体来讲,我们可以说线程是包含在进程中的,同一进程的多个不同的线程可以共享相同的资源。相比而言,进程之间不会共享资源。
每一个线程基本上包含3个元素:程序计数器,寄存器和栈。与同一进程的其他线程共享的资源基本上包括数据和系统资源。每一个线程也有自己的运行状态,可以和其他线程同步,这点和进程一样。线程的状态大体上可以分为ready,running,blocked。线程的典型应用是应用软件的并行化——为了充分利用现代的多核处理器,使每个核心可以运行单个线程。相比于进程,使用线程的优势主要是性能。相比之下,在进程之间切换上下文要比在统一进程的多线程之间切换上下文要重的多。
多线程编程一般使用共享内容空间进行线程间的通讯。这就使管理内容空间成为多线程编程的重点和难点。
多进程:
multiprocessing
是一个使用类似于threading
模块的 API 支持生成进程的包。该multiprocessing
包提供本地和远程并发,通过使用子进程而不是线程有效地绕过 全局解释器锁。因此,该multiprocessing
模块允许程序员充分利用给定机器上的多个处理器。它可以在 Unix 和 Windows 上运行。
该multiprocessing
模块还引入了threading
模块中没有类似物的 API 。一个主要的例子是 Pool
对象,它提供了一种方便的方法来并行化跨多个输入值的函数执行,跨进程分布输入数据(数据并行)。以下示例演示了在模块中定义此类函数的常见做法,以便子进程可以成功导入该模块。这个数据并行的基本示例使用Pool
多线程和多进程的区别: