【操作系统】进程(概念、状态与转换、控制、通信)与线程

一、进程概念

1.1 进程的定义

程序:一个指令序列

🔶 早期的计算机只支持单道程序

CPU只运行一个程序,内存也只加载一个程序,IO也只输出这一个程序的结果。在内存中:程序的代码放在程序段内,程序运行过程处理的数据放在数据段内(如变量)。

🔶 引入多道程序技术后

为了方便操作系统管理,完成各程序并发执行,引入了进程进程实体的概念。

内存中同时放入多道程序,各个程序的代码、运算数据存放的位置不同。系统为每个运行的程序配置一个数据结构,称为进程控制块(PCB)用来描述进程的各种信息(如程序代码存放位置)

程序段】、【数据段】、【PCB】三部分组成了【进程实体进程映像)】。一般情况下,我们把进程实体简称为进程。

创建线程:创建进程实体中的PCB。
撤销现场:撤销进程实体中的PCB。

PCB是进程存在的唯一标志。

🔶 从不同的角度,进程可以有不同的定义,比较传统典型的定义有:

1 进程是程序的一次执行过程
2 进程是一个程序及其数据在处理机上顺序执行时所发生的活动
3 进程是具有独立功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位。

均强调了进程的动态性。

🔶 引入进程实体的概念后,可把进程定义为:

进程是进程实体的运行过程,是系统进行资源分配调度的一个独立单位。

注:严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。不过,除非题目专门考察二者区别,否则可以认为进程实体就是进程。因此我们也可以说“进程由程序段、数据段、PCB三部分组成”

1.2 进程的组成

进程(进程实体)由程序段、数据段、PCB组成。
在这里插入图片描述
PCB:操作系统通过PCB来管理进程,因此PCB中应该包含操作系统对其进行管理所需的各种信息。
程序段:程序代码存放在此。
数据段:程序运行时使用、产生的运算数据。如全局变量、局部变量、宏定义的常量就存放在数据段内。
在这里插入图片描述

1.3 进程的组织

在一个系统中,通常由数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。

注:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题

1.3.1 链接方式

按照进程状态将PCB分为多个队列。操作系统持有指向各个队列的指针。

执行指针:指向当前处于运行态(执行态)的进程。
就绪队列指针:指向当前处于就绪态的进程。通常会把优先级高的进程放在队头。
阻塞队列指针:指向当前处于阻塞态的进程,很多操作系统还会根据阻塞原因不同,再分为多个阻塞队列。
在这里插入图片描述

1.3.2 索引方式

根据进程状态的不同,建立几张索引表。操作系统持有指向各个索引表的指针。
在这里插入图片描述

1.4 进程的特征

进程和程序是两个截然不同的概念,相比于程序,进程拥有以下特征:

  • 动态性:进程是程序的一次执行过程,是动态地产生、变化和消亡的。
  • 并发性:内存中由多个进程实体,各进程可并发执行。
  • 独立性:进程是能独立运行、独立获得资源、独立接受调度的基本单位。进程是资源分配、接受调度的基本单位。
  • 异步性:各进程按各自独立的、不可预知的速度向前推进,操作系统要提供进程同步机制来解决异步问题。
  • 结构性:每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成。

二、进程的状态与转换

2.1 进程的状态

进程是程序的一次执行。在这个执行过程中,有时进程正在被CPU处理,有时又需要等待CPU服务,可见,进程的状态是会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。

  • 运行态(Running):占用CPU,并在CPU上运行。
    单核处理机环境下,每一时刻最多只有一个进程处于运行态(双核环境下可以同时有两个进程处于运行态)
  • 就绪态(Ready):已经具备运行条件,但由于没有空闲CPU,暂时不能运行。
    进程已经拥有了除处理机之外所有需要的资源,一旦获得处理机,即可立即进入运行态开始运行。
  • 阻塞态(Waiting/Blocked):因等待某一件事而暂时不能运行。
    等待操作系统分配打印机、等待读磁盘操作的结果。CPU是计算机最昂贵的部件,为了提高CPU的利用率,需要先将其他进程需要的资源分配到位,才能得到CPU的服务。
  • 创建态(New,新建态):进程正在被创建,操作系统为进程分配资源、初始化PCB。
  • 终止态(Terminated,结束态):进程正在从系统中撤销,操作系统会回收进程拥有的资源、撤销PCB。

三态模型:运行态、就绪态、阻塞态
五态模型:创建态、终止态、运行态、就绪态、阻塞态

2.2 进程的转换

在这里插入图片描述

2.3 总结

在这里插入图片描述

三、进程的控制

进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。

简化理解:进程控制就是要实现进程状态转换。

创建进程:需要初始化PCB、分配系统资源。

创建态—>就绪态:修改PCB内容和相应的队列。
就绪态—>运行态:需恢复进程运行环境、修改PCB内容和相应队列。
运行态—>阻塞态:需保存进程运行环境、修改PCB内容和相应队列。
阻塞态—>就绪态:需修改PCB内容和相应队列。如果等待的是资源,则还需为进程分配系统资源。
运行态—>终止态:需回收进程拥有的资源,撤销PCB。
运行态—>阻塞态:需保存进程运行环境、修改PCB内容和相应队列。
在这里插入图片描述

原语实现进程控制。原语的特点是执行期间不允许中断,只能一气呵成。这种不可被中断的操作即原子操作。原语采用“关中断指令”和“开中断指令”实现。
在这里插入图片描述
显然,关/开中断指令的权限非常大,必然是只允许在核心态下执行的特权指令。

进程控制会导致进程状态的转换。无论哪个原语,要做的无非三类事情:

  1. 更新PCB中的信息(如修改进程状态标志、将运行环境保存到PCB、从PCB恢复运行环境)
    a.所有的进程控制原语—定都会修改进程状态标志
    b.剥夺当前运行进程的CPU使用权必然需要保存其运行环境
    c.某进程开始运行前必然要恢复期运行环境
  2. 将PCB插入合适的队列
  3. 分配/回收资源

🔶 进程创建
在这里插入图片描述
🔶 进程终止
在这里插入图片描述
🔶 进程阻塞和唤醒
在这里插入图片描述
🔶 进程切换
在这里插入图片描述

四、进程通信

进程通信就是指进程间的信息交互。

进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。

为了保证安全,一个进程不能直接访问另一个进程的地址空间。

但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。

4.1 共享存储

两个进程对共享空间的访问必须是互斥的( 互斥访问通过操作,系统提供的工具实现)。

操作系统只负责提供共享空间和同步互斥工具(如P、V操作)
在这里插入图片描述
两种共享存储:

基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。

基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。

4.2 管道通信

管道是指用于连接读写进程的一个共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的缓冲区。
在这里插入图片描述
1 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
2 各进程要互斥地访问管道。
3 数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞。
4 如果没写满,就不允许读。如果没读空,就不允许写。
5 数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据情况。

4.3 消息传递

进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。

消息由消息头消息体组成。

消息头包括:发生进程ID、接受进程ID、消息类型、消息长度等格式化信息(计算机网络中发送的报文就是一种格式化信息)

消息传递的方式:

  • 直接通信方式:消息直接挂到接收进程的消息缓冲队列上。
  • 间接通信方式:消息要先发送到中间实体(信箱)中,因此也称“信箱通信方式”。(如,计算机网络中的电子邮件系统)。
    在这里插入图片描述

五、线程

5.1 线程的概念

还没引入进程之前,系统中各个程序只能串行执行。

进程是程序的一次执行。如果我想用QQ同时实现视频、文字聊天、传输文件等功能,显然不可能是由一个程序顺序处理就能实现的。

有的进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序。为此,引入子“线程”,来增加并发度

传统的进程是程序执行流的最小单位。
引入进程后,线程成为了程序执行流的最小单位

可以把线程理解为轻量级进程。

线程是一个基本的CPU执行单元,也是程序执行流的最小单位

引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)

引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)

在这里插入图片描述

在这里插入图片描述

类比:去图书馆看书。
切换进程运行环境:有一个不认识的人要用桌子,你需要你的书收走,他把自己的书放到桌上
同一进程内的线程切换:你的舍友要用这张书桌,可以不把桌子上的书收走。

5.2 线程的属性

在这里插入图片描述

5.3 线程的实现方式

用户级线程(User-Level Thread,ULT)
在这里插入图片描述
用户级线程由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责(包括线程切换)

用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)

可以这样理解,“用户级线程”就是“从用户视角看能看到的线程”。

在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n个用户级线程映射到m个内核级线程上( n>= m)
在这里插入图片描述
重点:操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。

例如:上边这个模型中,该进程由两个内核级线程,三个用户级线程,在用户看来,这个进程中有三个线程。但即使该进程在一个4核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户线程并行执行。

5.4 多线程模型

在同时支持用户级线程和内核级线程的系统中,由几个用户级线程映射到几个内核级线程的问题引出了“多线程模型”问题。

🔶 多对一模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
在这里插入图片描述

优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行

🔶 一对一模型:一个用户级线程映射到一个内核级线程。每个用户进程有与用户及线程同数量的内核级线程。
在这里插入图片描述
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点: 一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

🔶 多对多模型:n用户级线程映射到m各内核级线程(n>=m)。每个用户进程对应m各内核级线程。
在这里插入图片描述
克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

望天边星宿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值