进程与线程

一、进程

概述

运行中的程序被称为进程。

中断

当进程要从硬盘读取数据时,CPU不需要阻塞等待数据的返回,而是去执行另外的进程。当硬盘数据返回时,CPU会收到个中断,于是CPU再继续运行这个进程。

并发与并行

对于⼀个支持多进程的系统,CPU 会从⼀个进程快速切换至另⼀个进程,其间每个进程各运行几十或几百个毫秒。 虽然单核的CPU在某⼀个瞬间,只能运行一个进程。但在1秒钟期间,它可能会运行多个进程,这样就产生并行的错觉,实际上这是并发。
在这里插入图片描述

进程与程序的类比

类比男生做菜
在这里插入图片描述

进程的状态

  • 创建状态:进程正在被创建时的状态
  • 就绪状态:可运行,由于其他进程处于运行状态而暂时停止运行
  • 运行状态:该时刻进程占用CPU
  • 阻塞状态:该进程正在等待某⼀事件发生(如等待输入/输出操作的完成)而暂时停止运行,这时,即使给它CPU控制权,它也无法运行
  • 结束状态:进程正在从系统中消失的状态

进程的状态转换

在这里插入图片描述
在虚拟内存管理的操作系统中,通常会把阻塞状态的进程的物理内存空间换出到硬盘,等需要再次运行的时候,再从硬盘换入到物理内存,这就需要⼀个新的状态,来描述进程没有占⽤实际的物理内存空间的情况,这个状态就是挂起状态。

  • 阻塞挂起状态:进程在外存(硬盘)并等待某个事件的出现
  • 就绪挂起状态:进程在外存(硬盘),但只要进入内存,即刻立刻运行
    在这里插入图片描述
    导致进程挂起的原因不只是因为进程所使⽤的内存空间不在物理内存,还包括如下情况
  • 通过sleep让进程间歇性挂起,其⼯作原理是设置⼀个定时器,到期后唤醒进程
  • 用户希望挂起⼀个程序的执行,比如在 Linux 中用Ctrl+Z挂起进程

进程的控制结构

在操作系统中,用进程控制块(PCB)数据结构来描述进程。
PCB是进程存在的唯一标识,包含以下信息

  • 进程描述信息
    • 进程标识符:标识各个进程,每个进程都有一个并且唯一的标识符
    • 用户标识符:进程归属的用户,用户标识符主要为共享和保护服务
  • 进程控制和管理信息
    • 进程当前状态:创建、就绪、运行、阻塞、结束
    • 进程优先级:进程抢占CPU的优先级
  • 资源分配清单:有关内存地址空间或虚拟地址空间的信息,所打开文件的列表和所使用的I/O设备信息
  • CPU相关信息:CPU中各个寄存器的值,当进程被切换时,CPU 的状态信息都会被保存在相应的PCB中,以便进程重新执行时,能从断点处继续执行

PCB的组织结构

链表方式

通常是通过链表的方式进行组织,把具有相同状态的进程链在⼀起,组成各种队列

  • 将所有处于就绪状态的进程链在⼀起,称为就绪队列
  • 把所有因等待某事件而处于等待状态的进程链在一起就组成各种阻塞队列
    在这里插入图片描述

索引方式

索引方式,它的工作原理:将同⼀状态的进程组织在⼀个索引表中,索引表项指向相应的 PCB,不同状态对应不同的索引表。
⼀般会选择链表,因为可能面临进程创建,销毁等调度导致进程状态发生变化,所以链表能够更加灵活的插⼊和删除

进程的控制

创建进程

操作系统允许⼀个进程创建另⼀个进程,而且允许子进程继承父进程所拥有的资源,当子进程被终止时, 其在进程处继承的资源应当还给父进程。同时,终止父进程时同时也会终止其所有的子进程。

  • 为新进程分配⼀个唯⼀的进程标识号,并申请⼀个空白的 PCB,PCB 是有限的,若申请失败则创建失败
  • 为进程分配资源,此处如果资源不足,进程就会进入等待状态,以等待资源
  • 初始化 PCB
  • 如果进程的调度队列能够接纳新进程,那就将进程插入到就绪队列,等待被调度运行

终止进程

进程可以有3种终止方式:正常结束、异常结束以及外界干预(信号 kill 掉)

  • 查找需要终止的进程的PCB
  • 如果处于执行状态,则立即终止该进程的执行,然后将CPU资源分配给其他进程
  • 如果其还有子进程,则应将其所有子进程终止
  • 将该进程所拥有的全部资源都归还给父进程或操作系统
  • 将其从PCB所在的队列删除

阻塞进程

  • 找到将要被阻塞进程标识号对应的PCB
  • 如果该进程为运行状态,则保护其现场,将其状态转为阻塞状态,停止运行
  • 将该 PCB 插⼊到阻塞队列中去

唤醒进程

进程由运行转变为阻塞状态是由于进程必须等待某⼀事件的完成,所以处于阻塞状态的进程是绝对不可能叫醒自己的。 如果某进程正在等待 I/O 事件,需由别的进程发消息给它,则只有当该进程所期待的事件出现时,才由发现者进程用唤醒语句叫醒它

  • 在该事件的阻塞队列中找到相应进程的 PCB
  • 将其从阻塞队列中移出,并置其状态为就绪状态
  • 把该PCB插入到就绪队列中,等待调度程序调度

进程的上下文切换

上下文

CPU 寄存器和程序计数是CPU在运行任何任务前,所必须依赖的环境,这些环境就叫做CPU上下文。

上下文切换

各个进程之间是共享CPU资源的,在不同的时候进程之间需要切换,让不同的进程可以在CPU执行,那么一个进程切换到另⼀个进程运行,称为进程的上下文切换。

CPU上下文切换的类型

根据任务的不同

  • 进程上下文切换
  • 线程上下文切换
  • 中断上下文切换

进程是由内核管理和调度的,所以进程的切换只能发生在内核态。 所以,进程的上下文切换不仅包含了虚拟内存、栈、全局变量等用户空间的资源,还包括了内核堆栈、寄 存器等内核空间的资源、系统内核会把交换的信息保存在进程的PCB,当要运行另外⼀个进程的时候,我们需要从这个进程的 PCB 取出上下文,然后恢复到 CPU 中,这使得这个进程可以继续执行。

进程上下文切换的场景

  • 为了保证所有进程可以得到公平调度,CPU时间被划分为⼀段段的时间片,这些时间片再被轮流分配给各个进程。这样,当某个进程的时间片耗尽了,进程就从运行状态变为就绪状态,系统从就绪队列选择另外⼀个进程运行
  • 进程在系统资源不足(比如内存不足)时,要等到资源满足后才可以运行,这个时候进程也会被挂起,并由系统调度其他进程运行;
  • 当进程通过睡眠函数 sleep 这样的⽅法将自己主动挂起时,自然也会重新调度
  • 当有优先级更高的进程运行时,为了保证高优先级进程的运行,当前进程会被挂起,由高优先级进程来运行;
  • 发生硬件中断时,CPU 上的进程会被中断挂起,转而执行内核中的中断服务程序

二、线程

概述

线程是进程当中的⼀条执行流程。
同⼀个进程内多个线程之间可以共享代码段、数据段、打开的文件等资源,但每个线程各自都有⼀套独立的寄存器和栈,这样可以确保线程的控制流是相对独立的。

优点

  • ⼀个进程中可以同时存在多个线程
  • 各个线程之间可以并发执行
  • 各个线程之间可以共享地址空间和文件等资源

缺点

当进程中的⼀个线程崩溃时,会导致其所属进程的所有线程崩溃。

进程与线程的比较

线程与进程最大的区别在于:线程是调度的基本单位,而进程则是资源拥有的基本单位。

  • 进程是资源(包括内存、打开的文件等)分配的单位,线程是 CPU 调度的单位
  • 进程拥有⼀个完整的资源平台,而线程只独享必不可少的资源,如寄存器和栈
  • 线程同样具有就绪、阻塞、执行三种基本状态,同样具有状态之间的转换关系
  • 线程能减少并发执行的时间和空间开销

线程相比进程能减少开销

  • 线程的创建时间比进程快,因为进程在创建的过程中,还需要资源管理信息,比如内存管理信息、文件管理信息,而线程在创建的过程中,不会涉及这些资源管理信息,而是共享它们
  • 线程的终止时间比进程快,因为线程释放的资源相比进程少很多
  • 同⼀个进程内的线程切换比进程切换快,因为线程具有相同的地址空间(虚拟内存共享),这意味着同⼀个进程的线程都具有同⼀个页表,那么在切换的时候不需要切换页表。而对于进程之间的切换, 切换的时候要把页表给切换掉,而页表的切换过程开销是比较大的
  • 由于同⼀进程的各线程间共享内存和文件资源,那么在线程之间数据传递的时候,就不需要经过内核 了,这就使得线程之间的数据交互效率更高了

线程的上下文切换

对于线程和进程

  • 当进程只有一个的时候,就认为线程就是进程
  • 当进程拥有多个线程的时候,这些线程会共享相同的虚拟内存和全局变量等资源,这些资源在上下文切换的时候是不需要被修改的
  • 当两个线程不属于同一个线程,则切换的过程就跟进程的切换是一样的
  • 当两个线程是属于同一个线程的时候,因为虚拟内存是共享的,所以在切换的时候,虚拟内存的资源就保持不动,只需要切换线程的私有数据、寄存器等不共享的数据

线程的实现

  • 用户线程(User Thread):在用户空间实现的线程,不是由内核管理的线程,是由用户态的线程库来完成线程的管理
  • 内核线程(Kernel Thread):在内核中实现的线程,是由内核管理的线程
  • 轻量级进程(LightWeight Process):在内核中来支持用户线程

用户线程

⽤户线程和内核线程的对应关系

  • 多(用户线程)对一(内核线程)
  • 一(用户线程)对一(内核线程)
  • 多(用户线程)对多(内核线程)

用户线程是基于用户态的线程管理库来实现的,那么线程控制块(Thread Control Block, TCB) 也是在库里面来实现的,对于操作系统而言是看不到这个TCB的,它只能看到整个进程的PCB。 所以,用户线程的整个线程管理和调度,操作系统是不直接参与的,而是由用户户级线程库函数来完成线程的管理,包括线程的创建、终止、同步和调度等。

优点
  • 每个进程都需要有它私有的线程控制块(TCB)列表,用来跟踪记录它各个线程状态信息(PC、栈指 针、寄存器),TCB 由用户级线程库函数来维护,可用于不支持线程技术的操作系统
  • 用户线程的切换也是由线程库函数来完成的,无需用户态与内核态的切换,所以速度特别快
缺点
  • 由于操作系统不参与线程的调度,如果⼀个线程发起了系统调用而阻塞,那进程所包含的用户线程都不能执行了。
  • 当⼀个线程开始运行后,除非它主动地交出 CPU 的使用权,否则它所在的进程当中的其他线程无法运行,因为用户态的线程没法打断当前运行中的线程,它没有这个特权,只有操作系统才有,但是用户线程不是由操作系统管理的。
  • 由于时间片分配给进程,故与其他进程比,在多线程执行时,每个线程得到的时间片较少,执行会比较慢。

内核线程

内核线程是由操作系统管理的,线程对应的TCB自然是放在操作系统里的,这样线程的创建、终止和管理 都是由操作系统负责

优点
  • 在⼀个进程当中,如果某个内核线程发起系统调用而被阻塞,并不会影响其他内核线程的运行
  • 分配给线程,多线程的进程获得更多的CPU运行时间
缺点
  • 在支持内核线程的操作系统中,由内核来维护进程和线程的上下文信息,如 PCB和TCB
  • 线程的创建、终止和切换都是通过系统调用的方式来进行,因此对于系统来说,系统开销比较大

轻量级进程

轻量级进程(Light-weight process,LWP)是内核支持的用户线程,⼀个进程可有⼀个或多个LWP,每个LWP是跟内核线程⼀对⼀映射的,也就是 LWP 都是由⼀个内核线程支持。
LWP与普通进程的区别也在于它只有⼀个最小的执行上下⽂和调度程序所需的统计信息。另外,LWP 只能由内核管理并像普通进程⼀样被调度,Linux 内核是支持 LWP 的典型例子,那么 LWP 与用户线程的对应关系就有三种

  • 1 : 1 ,即⼀个 LWP 对应⼀个用户线程
  • N : 1 ,即⼀个 LWP 对应多个用户线程
  • M : N ,即多个 LMP 对应多个用户线程

在这里插入图片描述

1:1模式(进程1)

⼀个线程对应到⼀个 LWP 再对应到⼀个内核线程

优点

实现并行,当⼀个 LWP 阻塞,不会影响其他 LWP

缺点

每⼀个用户线程,就产生一个内核线程,创建线程的开销较大

N:1模式(进程2)

多个用户线程对应⼀个 LWP 再对应⼀个内核线程

优点

用户线程要开几个都没问题,且上下文切换发生户空间,切换的效率较高

缺点

⼀个用户线程如果阻塞了,则整个进程都将会阻塞,另外在多核 CPU 中,是没办法充分利用CPU 的

M:N模式(进程3)

根据前面的两个模型混搭⼀起,就形成 M:N 模型,该模型提供了两级控制,首先先多个用户线程对应到多 个 LWP,LWP 再⼀⼀对应到内核线程

优点

综合了前两种优点,⼤部分的线程上下文发生在用户空间,且多个线程又可以充分利用多核 CPU 的资源

组合模式(进程5)

此进程结合1:1 模型和 M:N 模型。开发⼈员可以针对不同的应⽤特点调节内核线程的数目来达到物理并行性和逻辑并行性的最佳方案

三、调度

调度时机

在进程的⽣命周期中,当进程从⼀个运行状态到另外⼀状态变化的时候,其实会触发一次调度,根据如何处理时钟中断把调度算法分为两类

  • 非抢占式调度算法:挑选⼀个进程,然后让该进程运行直到被阻塞,或者直到该进程退出,才会调用另外⼀个进程,也就是说不会理时钟中断这个事情
  • 抢占式调度算法:挑选⼀个进程,然后让该进程只运行某段时间,如果在该时段结束时,该进程仍然在运行时,则会把它挂起,接着调度程序从就绪队列挑选另外⼀个进程。这种抢占式调度处理,需要在时间间隔的末端发生时钟中断,以便把 CPU 控制返回给调度程序进行调度,也就是常说的时间片机制。

调度原则

  • CPU利用率:调度程序应确保 CPU 是始终匆忙的状态,这可提高CPU的利用率
  • 系统吞吐量:吞吐量表示的是单位时间内 CPU 完成进程的数量,长作业的进程会占用较长的 CPU 资 源,因此会降低吞吐量,相反,短作业的进程会提升系统吞吐量
  • 周转时间:周转时间是进程运行和阻塞时间总和,⼀个进程的周转时间越小越好
  • 等待时间:这个等待时间不是阻塞状态的时间,而是进程处于就绪队列的时间,等待的时间越长,用户越不满意
  • 响应时间:用户提交请求到系统第⼀次产生响应所花费的时间,在交互式系统中,响应时间是衡量调度算法好坏的主要标准

调度算法

单核CPU

非抢占式的先来先服务(First Come First Seved, FCFS)算法

在这里插入图片描述
先来后到,每次从就绪队列选择最先进入队列的进程,然后⼀直运行,直到进程退出或被阻塞,才会继续从队列中选择第⼀个进程接着运行。
FCFS对长作业有利,适用于CPU 繁忙型作业的系统,而不适用于I/O 繁忙型作业的系统。

最短作业优先(Shortest Job First, SJF)调度算法

在这里插入图片描述
它会优先选择运行时间最短的进程来运行,这有助于提高系统的吞吐量,这显然对长作业不利,很容易造成⼀种极端现象,周转时间变长,致使长作业长期不会被运行。

高响应比优先 (Highest Response Ratio Next, HRRN)调度算法

权衡了短作业和长作业,每次进行进程调度时,先计算响应比优先级,然后把响应比优先级最高的进程投⼊运行。

响应比优先权=(等待时间+要求服务的时间)/要求服务的时间

  • 如果两个进程的等待时间相同时,要求的服务时间越短,响应比就越高,这样短作业的进程容易被选中运行
  • 如果两个进程要求的服务时间相同时,等待时间越长,响应比就越高,这就兼顾到了长作业进程,因为进程的响应比可以随时间等待的增加而提高,当其等待时间足够长时,其响应比便可以升到很高,从而获得运行的机会

时间片轮转(Round Robin, RR)调度算法

每个进程被分配⼀个时间段,称为时间片(Quantum),即允许该进程在该时间段中运行

  • 如果时间片用完,进程还在运行,那么将会把此进程从 CPU 释放出来,并把CPU分配给另外⼀个进程
  • 如果该进程在时间片结束前阻塞或结束,则 CPU立即进行切换
    在这里插入图片描述
    时间片的长度就是⼀个很关键的点
  • 如果时间片设得太短会导致过多的进程上下文换,降低了 CPU 效率
  • 如果设得太长又可能引起对短作业进程的响应时间变长

时间片设为 20ms~50ms 通常是⼀个比较合理的折中值

最高优先级(Highest Priority First,HPF)调度算法

能从就绪 队列中选择最⾼优先级的进程进行运行
进程的优先级可以分为,静态优先级和动态优先级

  • 静态优先级:创建进程时候,就已经确定了优先级了,然后整个运行时间优先级都不会变化
  • 动态优先级:根据进程的动态变化调整优先级,比如如果进程运行时间增加,则降低其优先级,如果进程等待时间(就绪队列的等待时间)增加,则升高其优先级,也就是随着时间的推移增加等待进程的优先级

该算法也有两种处理优先级高的方法,非抢占式和抢占式:

  • 非抢占式:当就绪队列中出现优先级高的进程,运行完当前进程,再选择优先级高的进程。
  • 抢占式:当就绪队列中出现优先级高的进程,当前进程挂起,调度优先级高的进程运行。

但是依然有缺点,可能会导致低优先级的进程永远不会运行

多级反馈队列(Multilevel Feedback Queue)调度算法

时间片轮转算法和最高优先级算法的综合和发展

  • 多级表示有多个队列,每个队列优先级从高到低,同时优先级越高时间片越短
  • 反馈表示如果有新的进程加入优先级高的队列时,立刻停止当前正在运行的进程,转而去运行优先级高的队列

在这里插入图片描述
如何工作

  • 设置了多个队列,赋予每个队列不同的优先级,每个队列优先级从高到低,同时优先级越高时间片越短
  • 新的进程会被放入到第⼀级队列的末尾,按先来先服务的原则排队等待被调度,如果在第⼀级队列规定的时间片没运行完成,则将其转⼊到第⼆级队列的末尾,以此类推,直至完成
  • 当较高优先级的队列为空,才调度较低优先级的队列中的进程运行。如果进程运行时,有新进程进⼊较高优先级的队列,则停止当前运行的进程并将其移入到原队列末尾,接着让较高优先级的进程运行

可以发现,对于短作业可能可以在第⼀级队列很快被处理完。对于⻓作业,如果在第⼀级队列处理不完, 可以移入下次队列等待被执行,虽然等待的时间变长了,但是运行时间也变更长了,所以该算法很好的兼顾了长短作业,同时有较好的响应时间。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值