python 多线程学习三(进程、线程与协程)
0x01 进程的引入
1、定义
通常的程序是静态实体(Passive Entity),在多道程序系统中,他们不能独立运行,更不能和其他程序并发执行。在操作系统中引入进程的目的,就是为了使多个程序能够并发执行。
2、特征
进程是指在系统中能够镀锡运行并作为资源分配的单元,它是一组机器指令、数据和堆栈等的组成,是一个能够独立运行的活动实体。多个进行之间可以并发执行和交换信息
3、状态及状态切换
3.1 基本转态
进程的三种基本转态:就绪(Ready)转态、执行转态、阻塞转态
进程三种基层转态及其转换:
3.2 引入挂起状态
引入原因:
1)终端用户的请求
2)父进程请求
3)负载调节的需要
4)操作系统的需要
引入后的进程转态:
1)活动就绪–>静止就绪
2)活动阻塞–>静止阻塞
3)静止就绪–>活动就绪
4)静止阻塞–>活动阻塞
5)挂起
引入挂起转态的进程状态:
3.3创建状态和终止状态
在当前实际的系统中,为了管理需要,还存在着两种比较常见的进程状态,即创建状态和终止状态。
创建状态:
一般需要两个步骤:
一、为一个新jin进程创建PCB,并填写必要的管理信息;
二、把该进程转入就绪状态并插入就绪队列。
终止转态:
一般也需要两个步骤:
一、等待操作系统进行善后处理;
二、将其PCB清零,并将PCB空间返回给系统;
增加创建状态和终止状态后,进程的三种基本状态及转换图演变为五种状态及转换关系:
增加创建状态和终止状态并具有挂起状态的进程状态及转换图:
0x02 线程的引入
1、线程引入原因
长期以来,进程都是操作系统中可以拥有资源并作为独立运行的基本单元。当一个进程因故不能运行时,,操作系统变调度另一个进程运行。由于进程拥有自己的资源,故使用调度付出的开销较大。由此,20世纪80年代中期,人们提出了比进程更小的单位–线程(Threads)。
2、特征
通常在一个进程中可以包含若干个线程,他们可以利用进程所拥有的资源。在引入线程的OS中,**通常都是吧进程作为分配资源的基本单位,而把线程作为独立运行和独立调度的基本单元。**由于线程比进程更小,基本上不拥有系统资源,故对它的调度所付出的开销就会小的多,能够高效地提高系统内多个程序并发执行的程度。
3、状态
线程具有五种状态:初始化、可运行、运行中、阻塞、销毁
线程状态转换:
操作系统中的进程和线程:
0x03 协程的引入
1、定义
协程:英文叫做Coroutine,又称为微线程、纤程,是一种用户态的轻量级纤程。
2、特征
本质上是单线程,拥有自己的寄存器上下文和栈。所以能够保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态。与多线程相比,无需使用多线程的锁机制。执行效率要高于多进程和多线程。
协程不是被操作系统内核所管理的,而是完全由程序所控制,也就是在用户态执行。这样带来的好处是性能大幅度的提升,因为不会像线程切换那样消耗资源。
协程不是进程也不是线程,而是一个特殊的函数,这个函数可以在某个地方挂起,并且可以重新在挂起处外继续运行。所以说,协程与进程、线程相比并不是一个维度的概念。
一个进程可以包含多个线程,一个线程也可以包含多个协程。简单来说,一个线程内可以由多个这样的特殊函数在运行,但是有一点必须明确的是,一个线程的多个协程的运行是串行的。如果是多核CPU,多个进程或一个进程内的多个线程是可以并行运行的,但是一个线程内协程却绝对是串行的,无论CPU有多少个核。毕竟协程虽然是一个特殊的函数,但仍然是一个函数。一个线程内可以运行多个函数,但这些函数都是串行运行的。当一个协程运行时,其它协程必须挂起。
操作系统中的协程:
0x04 对比
进程是应用程序的启动实例,进程拥有代码和打开的文件资源、数据资源、独立的内存空间。
线程从属于进程,是程序的实际执行者,一个进程至少包含一个主线程,也可以有更多的子线程,线程拥有自己的栈空间。
对操作系统而言,线程是最小的执行单元,进程是最小的资源管理单元。无论是进程还是线程,都是由操作系统所管理的。
进程、线程、协程的对比
协程既不是进程也不是线程,协程仅仅是一个特殊的函数,协程它进程和进程不是一个维度的。
一个进程可以包含多个线程,一个线程可以包含多个协程。
一个线程内的多个协程虽然可以切换,但是多个协程是串行执行的,只能在一个线程内运行,没法利用CPU多核能力。
协程与进程一样,切换是存在上下文切换问题的。
上下文切换
进程的切换者是操作系统,切换时机是根据操作系统自己的切换策略,用户是无感知的。进程的切换内容包括页全局目录、内核栈、硬件上下文,切换内容保存在内存中。进程切换过程是由“用户态到内核态到用户态”的方式,切换效率低。
线程的切换者是操作系统,切换时机是根据操作系统自己的切换策略,用户无感知。线程的切换内容包括内核栈和硬件上下文。线程切换内容保存在内核栈中。线程切换过程是由“用户态到内核态到用户态”, 切换效率中等。
协程的切换者是用户(编程者或应用程序),切换时机是用户自己的程序所决定的。协程的切换内容是硬件上下文,切换内存保存在用户自己的变量(用户栈或堆)中。协程的切换过程只有用户态,即没有陷入内核态,因此切换效率高。
参考:计算机操作系统第三版(原版)+汤小丹
参考:https://www.jianshu.com/p/6dde7f92951e