第2章 Linux多进程开发 2.1 进程概述 2.2 进程状态转换

第2章 Linux多进程开发

2.1进程概述

程序和进程

程序是包含一系列信息的文件,这些信息描述了如何在运行时创建一个进程:

  • 二进制格式标识:每个程序文件都包含用于描述可执行文件格式的元信息。内核利用此信息来解释文件中的其他信息。(ELF可执行连接格式)
  • 机器语言指令:对程序算法进行编码
  • 程序入口地址:标识程序开始执行时的起始指令位置
  • 数据:程序文件包含的变量初始值和程序使用的字面量值(比如字符串)
  • 符号表及重定位表:描述程序中函数和变量的位置及名称。这些表格有多重用途,其中包含调试和运行时的符号解析(动态链接)
  • 共享库和动态链接信息:程序文件所包含的一些字段,列出了程序运行时需要使用的共享库,以及加载共享库的动态链接器的路径名。
  • 其他信息:程序文件还包含许多其他信息,用以描述如何创建进程。

进程

  • 进程是正在运行的程序的实例。是一个具有一定独立功能的程序关于某个数据集合的一次运行活动,它是操作系统动态执行的基本单元,在传统的操作系统中,进程既是基本的分配单元,也是基本的执行单元。
  • 可以用一个程序来创建多个进程,进程是由内核定义的抽象实体,并为该实体分配用以执行程序的各项系统资源。从内核的角度看,进程由用户内存空间和一系列内核数据结构组成,其中用户内存空间包含了程序代码及代码所使用的变量,而内核数据结构则用于维护进程状态信息。记录在内核数据结构中的信息包含许多与进程相关的标识号(IDs)、虚拟内存表、打开文件的描述符表、信号传递及处理的有关信息、进程资源使用及限制、当前工作目录和大量的其他信息。

单道、多道程序设计

  • 单道程序,即在计算机内存中只允许一个程序运行
  • 多道程序设计技术是在计算机内存中同时存放几道相互独立的程序,使它们在管理程序控制下,相互穿插运行,两个或两个以上程序在计算机系统中同处于开始到结束之间的状态,这些程序共享计算机系统资源。引入多道程序设计的根本目的是为了提高CPU的利用率。
  • 对于一个单CPU系统来说,程序同时处于运行状态只是一种宏观上的概念,他们虽然都已经开始运行,但就微观而言,任意时刻,CPU上运行的程序只有一个
  • 在多道程序设计模型中,多个进程轮流使用CPU。而当下常见CPU为纳米级,1秒可以执行大约10亿条指令。由于人眼的反应速度是毫秒级,所以看似同时在运行。

时间片

  • 时间片(timeslice)又称为“量子(quantum)”或“处理器片(processor slice)”是操作系统分配给每个正在运行的进程微观上的一段CPU时间。事实上,虽然一台计算机通常可能有多个CPU,但是同一个CPU永远不可能真正地同时运行多个任务。在只考虑一个CPU的情况下,这些进程“看起来像”同时运行的,实则是轮番穿插地运行,由于时间片通常很短(在Linux上为5ms-800ms),用户不会感觉到。
  • 时间片由操作系统内核的调度程序分配给每个进程。首先,内核会给每个进程分配相等的初始时间片,然后每个进程轮番地执行相应地时间,当所有进程都处于时间片耗尽的状态时,内核会重新为每个进程计算并分配时间片,如此往复。

并行和并发

  • 并行(parallel):指在同一时刻,有多条指令在多个处理器上同时执行
  • 并发(concurrency) :指在同一时刻只能有一条指令执行,但多个进程指令被快速的轮换执行,使得在宏观上具有多个进程同时执行的效果,但在微观上并不是同时执行的,只是把时间分成若干段,使得多个进程快速交替的执行。

在这里插入图片描述

  • 并发是两个队列交替使用一台咖啡机
  • 并行是两个队列同时使用两台咖啡机

在这里插入图片描述

进程控制块

  • 为了管理进程,内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个PCB(Processing Control Block)进程控制块,维护进程相关的信息,Linux内核的进程控制块是task_struct结构体。
  • 在/usr/src/linux-headers-xxx./include/linux/sched,h文件中可以查看struct task_struct结构体定义。其内部成员有很多,我们只需要掌握以下部分即可:
    –进程id:系统中每个进程有唯一的id,用pid_t类型表示,其实就是一个非负整数
    –进程的状态:有就绪、运行、挂起、停止等状态
    –进程切换时需要保存和恢复的一些CPU寄存器
    –描述虚拟地址空间的信息
    –描述终端的信息
    –当前工作目录(Current Working Directory)
    –umask掩码
    –文件描述符表,包含很多指向file结构体的指针
    –和信号相关的信息
    –用户id和组id
    –会话(Session)和进程组
    –进程可以使用的资源上限(Resource Limit)。ulimit -a 指令显示资源上限。

2.2进程状态转换

进程的状态

在这里插入图片描述
进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中,进程状态分为三个基本状态:就绪态、运行态、阻塞态。在五态模型中,进程分为新建态、就绪态、运行态、阻塞态、终止态。

  • 运行态:进程占有处理器正在运行
  • 就绪态:进程具备运行条件。等待系统分配处理器以便运行。当进程已分配到除CPU以外的所有必要资源后,只要再获得CPU,便可立即执行。在一个系统中处于就绪态的进程可能有多个,通常将它们排成一个队列,称为就绪队列
  • 阻塞态:又称为等待(wait)态或睡眠态(sleep),指进程不具备运行条件,正在等待某个事件的完成
  • 新建态:进程刚被创建时的状态,尚未进入就绪队列
  • 终止态:进程完成任务到达正常结束点,或出现无法克服的错误而异常终止,或被操作系统及有终止权的进程所终止时所处的状态。进入终止态的进程以后不再执行,但依然保留在操作系统中等待善后。一旦其他进程完成了对终止态进程的信息抽取之后,操作系统将删除该进程。

进程相关命令

查看进程

  • ps aux/ajx
  • a:显示终端上的所有进程,包括其他用户的进程
  • u:显示进程的详细信息
  • x:显示没有控制终端的进程
  • j:列出与作业控制相关的信息

在这里插入图片描述
tty为终端号, stat为状态,start为开始时间,time为持续的时间,command为执行的命令

在这里插入图片描述
PID为进程的ID,PPID为父进程的ID,PGID为进程组的ID,SID为会话ID。

STAT参数意义

  • D :不可中断 Uninterruptible(usually IO)
  • R :正在运行,或在队列中的进程
  • S:(大写) 处于休眠状态
  • T :停止或被追踪
  • Z :僵尸进程
  • W :进入内存交换(从内核2.6开始无效)
  • X :死掉的进程
  • < :高优先级
  • N :低优先级
  • s :包含子进程
  • +:位于前台的进程组

实时显示进程动态
top
可以在使用top命令时加上-d来指定显示信息更新的时间间隔,在top命令执行后,可以按以下按键对显示的结果进行排序。

  • M:根据内存使用量排序
  • P:根据CPU占有率排序
  • T:根据进程运行时间长短排序
  • U:根据用户名来筛选进程
  • K:输入指定的PID杀死进程

杀死进程

  • kill [-signal] pid
  • kill -l 列出所有信号
  • kill -SIGKILL 进程ID:强制杀死该进程
  • kill -9 进程ID:强制杀死该进程
  • killall name 根据进程名杀死进程

./a.out &表示后台运行,只执行其他指令

进程号和相关函数

  • 每个进程都由进程号来标识,其类型为pid_t(整型),进程号的范围:0-32767。进程号总是唯一的,但可以重用。当一个进程终止后,其进程号就可以再次使用。
  • 任何进程(除init进程)都是由另一个进程创建,该进程称为被创建进程的父进程,对应的进程号称为父进程号(PPID)
  • 进程组是一个或多个进程的集合。它们之间相互关联,进程组可以接收同一终端的各种信号,关联的进程有一个进程组号(PGID)。默认情况下,当前的进程号会当作当前的进程组号
  • 进程号和进程组相关函数
    pid_t getpid(void);
    pid_t getppid(void);
    pid_t getpgid(pid_t pid);
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值