先看一个小故事:
为了使我们写的代码能够自己跑起来,我们将它送进了城(进程)里。
既然进了城里,就要遵守城里人的规矩,城中有个专门管辖你们的 城管(操作系统),人家让你休息就休息,让你工作就工作,毕竟 摊位(CPU)不多,而要工作的人多着去了,每个人都想要占这个摊位来工作。
所以 城管(操作系统)为了公平起见,使用了一种 策略(调度),给每个人一个固定的工作时间 (时间片),时间到了就会通知你去休息,换另外一个人上场工作。另外,你在休息时候也不能偷懒,要记住工作到哪了,不然下次到你工作了,你忘记工作到哪了,那还怎么继续?
当然,一个城中肯定还有不少 县城(线程)。有的人就进入了 县城(线程)工作,这里相对轻松一些,在休息的时候,要记住的东西相对较少,而且还能共享城里的资源。
通过这个故事,我们是不是对进程线程有了个大概的印象。什么!没有?也没关系,接下来的正文我们就详细探讨下进程,线程的运作。
一、为什么使用线程
在早期的操作系统中都是以进程作为独立运行的基本单位,直到后面,计算机科学家们又提出了更小的能独立运行的基本单位,也就是「线程」
那么,有了进程为什么还要使用线程呢?
我们举个例子,假设你要编写一个视频播放器软件,那么该软件功能的核心模块有三个:
☞ 从视频文件当中读取数据;
☞ 对读取的数据进行解压缩;
☞ 把解压缩后的视频数据播放出来;
对于单进程的实现方式,我想大家都会是以下这个方式::
![](https://img-blog.csdnimg.cn/bfefd7d5af80407f816295fc48be5de9.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
对于单进程的这种方式,存在以下问题:
☞ 播放出来的画面和声音会不连贯,因为当 CPU 能力不够强的时候,Read 的时候可能进程就等在这了,这样就会导致等半天才进行数据解压和播放;
☞ 各个函数之间不是并发执行,影响资源的使用效率;
那改进成多进程的方式:
![](https://img-blog.csdnimg.cn/5083eed4f6334fdcb2257991d07102ef.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
对于多进程的这种方式,依然会存在问题:
☞ 进程之间如何通信,共享数据?
☞ 维护进程的系统开销较大,如创建进程时,分配资源、建立 PCB;终止进程时,回收资源、撤销 PCB;进程切换时,保存当前进程的状态信息;
那到底如何解决呢?需要有一种新的实体,满足以下特性:
☞ 实体之间可以并发运行;
☞ 实体之间共享相同的地址空间;
这个新的实体,就是线程( Thread ),线程之间可以并发运行且共享相同的地址空间。
二、什么是线程
线程是进程当中的一条执行流程。
同一个进程内多个线程之间可以共享代码段、数据段、打开的文件等资源,但每个线程都有独立一套的寄存器和栈,这样可以确保线程的控制流是相对独立的。
![](https://img-blog.csdnimg.cn/7a3344e0222a4f55aa644e60195f6198.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
那线程有什么优缺点呢?
线程的优点:
☞ 一个进程中可以同时存在多个线程;
☞ 各个线程之间可以并发执行;
☞ 各个线程之间可以共享地址空间和文件等资源;
线程的缺点:
☞ 当进程中的一个线程奔溃时,会导致其所属进程的所有线程奔溃。
举个例子,对于游戏的用户设计,则不应该使用「多线程」的方式,否则一个用户挂了,会影响其他同个进程的线程。
三、线程与进程的比较
线程与进程的比较如下:
☞ 进程是资源(包括内存、打开的文件等)分配的单位,线程是 CPU 调度的单位;
☞ 进程拥有一个完整的资源平台,而线程只独享必不可少的资源,如寄存器和栈;
☞ 线程同样具有就绪、阻塞、执行三种基本状态,同样具有状态之间的转换关系;
☞ 线程能减少并发执行的时间和空间开销;
对于线程相比进程能减少开销,体现在:
☞ 线程的创建时间比进程快,因为进程在创建的过程中,还需要资源管理信息,比如内存管理信息、文件管理信息,而线程在创建的过程中,不会涉及这些资源管理信息,而是共享它们;
☞ 线程的终止时间比进程快,因为线程释放的资源相比进程少很多;
☞ 同一个进程内的线程切换比进程切换快,因为线程具有相同的地址空间(虚拟内存共享),这意味着同一个进程的线程都具有同一个页表,那么在切换的时候不需要切换页表。而对于进程之间的切换,切换的时候要把页表给切换掉,而页表的切换过程开销是比较大的;
☞ 由于同一进程的各线程间共享内存和文件资源,那么在线程之间数据传递的时候,就不需要经过内核了,这就使得线程之间的数据交互效率更高了;
所以,线程比进程不管是时间效率,还是空间效率都要高。
四、线程的上下文切换
在前面我们知道了,线程与进程最大的区别在于:线程是调度的基本单位,而进程则是资源拥有的基本单位。
所以,所谓操作系统的任务调度,实际上的调度对象是线程,而进程只是给线程提供了虚拟内存、全局变量等资源。
对于线程和进程,我们可以这么理解:
☞ 当进程只有一个线程时,可以认为进程就等于线程;
☞ 当进程拥有多个线程时,这些线程会共享相同的虚拟内存和全局变量等资源,这些资源在上下文切换时是不需要修改的;
另外,线程也有自己的私有数据,比如栈和寄存器等,这些在上下文切换时也是需要保存的。
线程上下文切换的是什么?
这还得看线程是不是属于同一个进程:
☞ 当两个线程不是属于同一个进程,则切换的过程就跟进程上下文切换一样;
☞ 当两个线程是属于同一个进程,因为虚拟内存是共享的,所以在切换时,虚拟内存这些资源就保持不动,只需要切换线程的私有数据、寄存器等不共享的数据;
所以,线程的上下文切换相比进程,开销要小很多。
五、线程的实现
线程的三种实现方式:
☞ 用户线程(User Thread):在用户空间实现的线程,不是由内核管理的线程,是由用户态的线程库来完成线程的管理;
☞ 内核线程(Kernel Thread):在内核中实现的线程,是由内核管理的线程;
☞ 轻量级进程(LightWeight Process):在内核中来支持用户线程;
那么,这还需要考虑一个问题,用户线程和内核线程的对应关系。
首先,第一种关系是多对一的关系,也就是多个用户线程对应同一个内核线程:
![](https://img-blog.csdnimg.cn/3ed3b5205da24493aabd2de947a7e3f4.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
第二种是一对一的关系,也就是一个用户线程对应一个内核线程:
![](https://img-blog.csdnimg.cn/2a2fc6d5a0834592b70a9c8d2d1b2531.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
第三种是多对多的关系,也就是多个用户线程对应到多个内核线程:
![](https://img-blog.csdnimg.cn/032a6e55401847a49cd113e390f3e70f.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
用户线程如何理解?存在什么优势和缺陷?
用户线程是基于用户态的线程管理库来实现的,那么线程控制块(Thread Control Block, TCB) 也是在库里面来实现的,对于操作系统而言是看不到这个 TCB 的,它只能看到整个进程的 PCB。
所以,用户线程的整个线程管理和调度,操作系统是不直接参与的,而是由用户级线程库函数来完成线程的管理,包括线程的创建、终止、同步和调度等。
用户级线程的模型,也就类似前面提到的多对一的关系,即多个用户线程对应同一个内核线程,如下图所示:
![](https://img-blog.csdnimg.cn/1d602888c53f4ac4b0a8da12f4d81987.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
用户线程的优点:
☞ 每个进程都需要有它私有的线程控制块(TCB)列表,用来跟踪记录它各个线程状态信息(PC、栈指针、寄存器),TCB 由用户级线程库函数来维护,可用于不支持线程技术的操作系统;
☞ 用户线程的切换也是由线程库函数来完成的,无需用户态与内核态的切换,所以速度特别快;
用户线程的缺点:
☞ 由于操作系统不参与线程的调度,如果一个线程发起了系统调用而阻塞,那进程所包含的用户线程都不能执行了。
☞ 当一个线程开始运行后,除非它主动地交出 CPU 的使用权,否则它所在的进程当中的其他线程无法运行,因为用户态的线程没法打断当前运行中的线程,它没有这个特权,只有操作系统才有,但是用户线程不是由操作系统管理的。
☞ 由于时间片分配给进程,故与其他进程比,在多线程执行时,每个线程得到的时间片较少,执行会比较慢;
以上,就是用户线程的优缺点了。
那内核线程如何理解?存在什么优势和缺陷?
内核线程是由操作系统管理的,线程对应的 TCB 自然是放在操作系统里的,这样线程的创建、终止和管理都是由操作系统负责。
内核线程的模型,也就类似前面提到的一对一的关系,即一个用户线程对应一个内核线程,如下图所示:
内核线程的优点:
☞ 在一个进程当中,如果某个内核线程发起系统调用而被阻塞,并不会影响其他内核线程的运行;
☞ 分配给线程,多线程的进程获得更多的 CPU 运行时间;
内核线程的缺点:
☞ 在支持内核线程的操作系统中,由内核来维护进程和线程的上下问信息,如 PCB 和 TCB;
☞ 线程的创建、终止和切换都是通过系统调用的方式来进行,因此对于系统来说,系统开销比较大;
以上,就是内核线的优缺点了。
最后的轻量级进程如何理解?
轻量级进程(Light-weight process,LWP)是内核支持的用户线程,一个进程可有一个或多个 LWP,每个 LWP 是跟内核线程一对一映射的,也就是 LWP 都是由一个内核线程支持。
另外,LWP 只能由内核管理并像普通进程一样被调度,Linux 内核是支持 LWP 的典型例子。
在大多数系统中,**LWP与普通进程的区别也在于它只有一个最小的执行上下文和调度程序所需的统计信息。**一般来说,一个进程代表程序的一个实例,而 LWP 代表程序的执行线程,因为一个执行线程不像进程那样需要那么多状态信息,所以 LWP 也不带有这样的信息。
在 LWP 之上也是可以使用用户线程的,那么 LWP 与用户线程的对应关系就有三种:
☞ 1 : 1,即一个 LWP 对应 一个用户线程;
☞ N : 1,即一个 LWP 对应多个用户线程;
☞ N : N,即多个 LMP 对应多个用户线程;
接下来针对上面这三种对应关系说明它们优缺点。先下图的 LWP 模型:
内核线程的模型,也就类似前面提到的一对一的关系,即一个用户线程对应一个内核线程,如下图所示:
![](https://img-blog.csdnimg.cn/62d3fd7a78b449919bad05cd18603bef.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_5,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3hpYW9tdV9Z,size_1,color_FFFFFF,t_70#pic_center)
1 : 1 模式
一个线程对应到一个 LWP 再对应到一个内核线程,如上图的进程 4,属于此模型。
☞ 优点:实现并行,当一个 LWP 阻塞,不会影响其他 LWP;
☞ 缺点:每一个用户线程,就产生一个内核线程,创建线程的开销较大。
N : 1 模式
多个用户线程对应一个 LWP 再对应一个内核线程,如上图的进程 2,线程管理是在用户空间完成的,此模式中用户的线程对操作系统不可见。
☞ 优点:用户线程要开几个都没问题,且上下文切换发生用户空间,切换的效率较高;
☞ 缺点:一个用户线程如果阻塞了,则整个进程都将会阻塞,另外在多核 CPU 中,是没办法充分利用 CPU 的。
M : N 模式
根据前面的两个模型混搭一起,就形成 M:N 模型,该模型提供了两级控制,首先多 个用户线程对应到多个 LWP,LWP 再一一对应到内核线程,如上图的进程 3。
☞ 优点:综合了前两种优点,大部分的线程上下文发生在用户空间,且多个线程又可以充分利用多核 CPU 的资源。
组合模式
如上图的进程 5,此进程结合 1:1 模型和 M:N 模型。开发人员可以针对不同的应用特点调节内核线程的数目来达到物理并行性和逻辑并行性的最佳方案。