Linux--进程的概念(一)

一、冯诺依曼体系结构

  根据冯诺依曼体系结构构成的计算机,必须具有如下功能
(1)把需要的程序和数据送至计算机中。
(2)必须具有长期记忆程序、数据、中间结果及最终运算结果的能力。
(3)能够完成各种算术、逻辑运算和数据传送等数据加工处理的能力。
(4)能够按照要求将处理结果输出给用户。
  为了完成上述的功能,计算机必须具备五大基本组成部件,包括
(1)输入数据和程序的输入设备:(键盘、磁盘、网卡、显卡、话筒、摄像头等)
(2)输出处理结果的输出设备:(显示器、磁盘、网卡、显卡、音响等)
(3)记忆程序和数据的存储器:(内存)
(4)完成数据加工处理的运算器(CPU)
(5)控制程序执行的控制器(CPU)
在这里插入图片描述
  从上图的结构可以看出,当输入设备获取到数据信号后,先将其转入内存,经由CPU的处理后,返还给内存,再由输出设备接收,让用户获取到相应的信息。
  为什么冯诺依曼体系结构要多设计一个存储器,也就是内存
  在此之前先了解一下计算机的存储分级,其中寄存器离CPU最近;L1、L2、L3是对应的三级缓存;主存通常指的是内存;本地存储(硬盘)和远程存储通常指的是外设。
  存储器的特点:离CPU更近,存储容量更小、速度更快、成本更高,如主存往上的;离CPU更远的,则相反,如本地磁盘。如图是存储器存储速度的金字塔结构。

在这里插入图片描述

二、操作系统

2.1 什么是操作系统

  任何计算机系统都包含一个基本的程序集合,称为操作系统(OS)。笼统的理解,操作系统包括:

  • 内核(进程管理,内存管理,文件管理,驱动管理)
  • 其他程序(例如函数库,shell程序等)

设计OS的目的
(1)与硬件交互,管理所有的软硬件资源
(2)为用户程序(应用程序)提供一个良好的执行环境

定位
(1)在整个计算机软硬件架构中,操作系统的定位是:一款纯正的“搞管理”的软件

如何理解“管理”
(1)管理的例子
(2)描述被管理对象
(3)组织被管理对象
俗称:先描述,再组织

在这里插入图片描述
  上图就是一个计算机软硬件体系结构,操作系统也是软件
(1)描述起来,用struct结构体,软件和硬件都是这样的
(2)组织起来,用链表或者其他高效的数据结构
(3)操作系统通过驱动程序管理底层硬件
(4)在开发角度,操作系统会对外表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口叫做系统调用,其实本质就是C函数,因为Linux底层是用C语言写的。
(5)系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以有心的开发者可以对部分系统调用进行适度封装,从而形成了库。由于系统调用过于复杂,因此出现了图形化界面,shell和工具集。

2.2 操作系统的意义

总结
计算机管理硬件
(1)描述起来,用struct结构体
(2)组织起来,用链表或者其他高效的数据结构
系统调用和库函数概念
(1)在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口及,叫做系统调用。
(2)系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以,有心的开发者可以对部分系统调用进行适度封装,从而形成库,有了库,就很有利于跟上层用户或者开发者进行二次开发。

三、进程

3.1 进程的基本概念

  课本概念:程序的一个执行实例,正在执行的程序等。
  内核观点:担当分配系统资源(CPU时间,内存)的实体。

3.2 描述进程——PCB

  进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
  课本上称之为PCB(process control block),Linux操作系统下的PCB是:task_struct

  操作系统和CPU运行某一个进程,本质就是从task_struct 形成的队列中挑选一个task_struct,来执行它的代码
  进程调度,变成了在task_struct的队列中选择一个进程的过程!
  只要想到进程,优先想到进程对应的task_struct
  当我们已经准备return了,我们的核心代码执行完了吗? 已经执行完了!

3.3 进程和程序的区别

进程的组成
  进程一般由程序、数据集合和进程控制块三部分组成。
即:进程=内核数据结构(PCB)+该程序的代码+数据集合
进程和程序的区别
  程序是代码编译后的静态文件
  进程是正在运行的动态实例

3.4 task_struct-PCB的一种

  进程控制块(PCB)是描述进程的,在C++当中我们称之为面向对象,而在C语言当中我们称之为结构体,既然Linux操作系统是用C语言进行编写的,那么Linux当中的进程控制块必定是用结构体来实现的。

  • PCB实际上是对进程控制块的统称,在Linux中描述进程的结构体叫做task_struct。
  • task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含进程的信息。

3.5 task_struct的内容分类

  task_struct就是Linux当中的进程控制块,task_struct当中主要包含以下信息:

  • 标示符:描述本进程的唯一标示符,用来区别其他进程
  • 状态:任务状态,退出代码,退出信号等。
  • 优先级:相对于其他进程的优先级
  • 程序计数器(pc):程序中即将被执行的下一条指令的地址。
  • 内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。
  • 上下文数据:进程执行时处理器的寄存器中的数据
  • I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
  • 记账信息:可能包括处理器时间总和,使用的时钟总和,时间限制,记帐号等。
  • 其他信息

四、如何查看进程

4.1 通过系统文件查看进程

  在根目录下有一个名为proc的系统文件夹
在这里插入图片描述
  文件夹当中包含大量进程信息,其中有些子目录的目录名为数字
在这里插入图片描述
  这些数字其实是某一进程的PID,对应文件夹当中记录着对应进程的各种信息。我们若想查看PID为1的进程的进程信息,则查看名字为1的文件夹即可。
在这里插入图片描述

4.2 通过ps指令查看进程

  单独使用ps命令,会显示所有进程信息

[zl@VM-16-2-centos lesson12]$ ps axj

在这里插入图片描述
  ps命令与grep命令搭配使用,即可只显示某一进程的信息

[zl@VM-16-2-centos lesson11]$ ps axj | head -1 && ps axj | grep 'myproc'

在这里插入图片描述

五、如何获取pid和ppid

  想要获取到pid和ppid,就要用到系统调用接口:
pid_t getpid(void)–返回的是子进程ID
pid_t getppid(void)–返回的是父进程ID

5.1 getpid()–获取子进程(pid)

#include<stdio.h>
#include<unistd.h>
int main()
{
	printf("I am child pid: %d\n",getpid());
	return 0;
}

5.2 getppid()–获取父进程(ppid)

#include<stdio.h>
#include<unistd.h>
int main()
{
	printf("I am father pid: %d\n",getppid());
	return 0;
}

  通过系统调用函数,getpid和getppid即可分别获取进程的PID和PPID。
在这里插入图片描述
在这里插入图片描述
  我们可以通过ps命令查看该进程的信息,即可发现通过ps命令得到的进程的PID和PPID与使用系统调用函数getpid和getppid所获取的值相同。
在这里插入图片描述

六、进程的创建–fork初识

6.1 四种主要事件会导致进程的创建

(1)系统初始化
(2)正在运行的程序执行了创建程序的系统调用
(3)用户请求创建一个新进程
(4)一个批处理作业的初始化

为什么会有两个返回值?
(1)因为fork内部,父子各自会执行自己的return语句
(2)返回两次,并不意味着会保存两次?

父子进程被创建出来,哪一个进程先运行呢?
   不一定!,谁先运行,不一定,这个是由操作系统的调度器决定的!

6.2 用户如何请求创建一个新进程

  fork是一个系统调用级别的函数,其功能就是创建一个子进程
在这里插入图片描述
  若是代码当中没有fork函数,我们都知道代码的运行结果就是打印该进程的PID和PPID。而加入了fork函数后,代码运行结果如下:
在这里插入图片描述
  运行结果是打印两行数据,一行数据是该进程的PID和PPID,二行数据是代码中fork函数创建的子进程的PID和PPID。我们可以发现fork函数创建的进程的PPID就是proc进程的PID,也就是说proc进程与fork函数创建的进程之间是父子关系。
  说明:使用fork函数创建子进程后就有了两个进程,这两个进程被操作系统调度的顺序是不确定的,这取决于操作系统调度算法的具体实现。

6.3 如何让父子进程各有所需

  上面说到,fork函数创建出来的子进程与其父进程共同使用一份代码,但我们如果真的让父子进程做相同的事情,那么创建子进程就没有什么意义了。
  实际上,在fork之后我们通常使用if语句进行分流,即让父进程和子进程做不同的事。
fork函数的返回值
(1)如果子进程创建成功,在父进程中返回子进程的PID,而在子进程中返回0。
(2)如果子进程创建失败,则在父进程中返回-1。
  既然父进程和子进程获取到的fork函数的返回值不同,那么我们就可以据此来让父子进程执行不同的代码,从而做不同的事。
在这里插入图片描述
  fork创建出子进程后,子进程会进入到if语句的循环打印当中,而父进程会进入到else if语句的循环打印当中。
在这里插入图片描述

七、进程的状态

7.1 进程状态有哪些

  系统中一定是存在各种资源的(不仅仅是CPU)网卡,磁盘,显卡,等其他设备。系统中不只是只存在一种队列!
  CPU对进程处理,取决于当前进程所处的状态,CPU对于不同状态的进程会采取不同的措施。
  新建状态:字面意思,没有入队列的状态就是新建状态。
  运行状态:task_struct结构体在运行队列中排队,叫做运行态。
  阻塞状态:等待非CPU资源就绪,阻塞状态!
  挂起状态:当内存不足的时候,OS通过适当的置换进程的代码和数据到磁盘,进程的状态就叫做挂起!
  退出状态:字面意思

在这里插入图片描述  这里具体谈一下Linux操作系统中的进程状态,Linux操作系统的源代码当中对于进程状态有如下定义:

/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)",        /* 0  */  //正在运行,不可中断
"S (sleeping)",       /* 1  */  //正在等待某件事情完成,可中断睡眠
"D (disk sleep)",     /* 2  */  //处于休眠状态
"T (stopped)",        /* 4  */  //停止或被追踪(调试)
"t (tracing stop)",   /* 8  */  //追踪(调试)状态,类似于vs下打断点后直接运行到断点处
"X (dead)",           /* 16 */  //死掉的进程
"Z (zombie)",         /* 32 */  //僵尸进程
};

有+号就是表示在前台进行运行进程,加&表示在后台进行运行进程
R:对应上面的运行态。
S:对应的就是上面的阻塞状态,可中断睡眠。 (挂起状态也是S)
D:睡眠状态,磁盘睡眠,深度睡眠,不可被中断,不可以被被动唤醒。(和S差不多,只是不可被中断)
(当服务器压力过大的时候,OS会通过一定的手段,杀掉一些进程,来起到节省空间的作用!S状态可以杀,D状态不可以杀,只能等这个进程自动醒来)(dd命令能够演示D状态进程)
T:暂停状态 调试 。
t:追踪(调试)状态,在linux中使用gdb进行打断点进行调试时的状态
X:终止状态 瞬时性非常强(很难捕捉到)
Z:僵尸状态:一个进程已经退出,但是还不允许被OS释放,处于一个被检测的状态(一般是父进程或者OS)(维持该状态,为了让父进程和OS来进行回收!)
说明:进程的当前状态是保存到自己的进程控制块(PCB)当中的,在Linux操作系统当中也就是保存在task_struct当中的。

7.2 进程状态的查看

  在Linux操作系统当中我们可以通过 ps axj命令查看进程的状态。

[zl@VM-16-2-centos lesson12]$ ps axj

在这里插入图片描述

7.3 进程状态的分析

7.3.1 运行状态–R

  一个进程处于运行状态(running),并不意味着进程一定处于运行当中,运行状态表明一个进程要么在运行中,要么在运行队列里。也就是说,可以同时存在多个R状态的进程。
  说明:所有处于运行状态,即可被调度的进程,都被放到运行队列当中,当操作系统需要切换进程运行时,就直接在运行队列中选取进程运行。

7.3.2 浅度睡眠状态–S

  一个进程处于浅度睡眠状态(sleeping),意味着该进程正在等待某件事情的完成,处于浅度睡眠状态的进程随时可以被唤醒,也可以被杀掉(用kill -9 PID进程杀掉)(这里的睡眠有时候也可叫中断睡眠(interruptible sleep))

7.3.3 深度睡眠状态–D

  一个进程处于深度睡眠状态(disk sleep),表示该进程不会被杀掉,即便是操作系统也不行,只有该进程自动唤醒才可以恢复。该状态有时候也叫不可中断睡眠状态(uninterruptible sleep),处于这个状态的进程通常会等待IO的结束。
  例如,某一进程要求对磁盘进行写入操作,那么在磁盘进行写入期间,该进程就处于深度睡眠状态,是不会被杀掉的,因为该进程需要等待磁盘的回复(是否写入成功)以做出相应的应答。(磁盘休眠状态)

7.3.4 停止状态–T

  在Linux当中,我们可以通过发送SIGSTOP信号使进程进入停止状态(stopped),发送SIGCONT信号可以让处于停止状态的进程继续运行。

7.3.5 僵尸状态–Z

  当一个进程将要退出的时候,在系统层面,该进程曾经申请的资源并不是立即被释放,而是要暂时存储一段时间,以供操作系统或是其父进程进行读取,如果退出信息一直未被读取,则相关数据是不会被释放掉的,一个进程若是正在等待其退出信息被读取,那么我们称该进程处于僵尸状态(zombie)
  首先,僵尸状态的存在是必要的,因为进程被创建的目的就是完成某项任务,那么当任务完成的时候,调用方是应该知道任务的完成情况的,所以必须存在僵尸状态,使得调用方得知任务的完成情况,以便进行相应的后续操作。

7.3.6 死亡状态–X

  死亡状态只是一个返回状态,当一个进程的退出信息被读取后,该进程所申请的资源就会立即被释放,该进程也就不存在了。所以你不会在任务列表当中看到死亡状态(dead)

八、僵尸进程与孤儿进程

8.1 僵尸进程

  前面说到,一个进程若是正在等待其退出信息被读取,那么我们称该进程处于僵尸状态。而处于僵尸状态的进程,我们就称之为僵尸进程。

8.1.1 僵尸进程的危害进程

(1)僵尸进程的退出状态必须一直维持下去,因为它要告诉其父进程相应的退出信息。可是父进程一直不读取,那么子进程也就一直处于僵尸状态。
(2)僵尸进程的退出信息被保存在task_struct(PCB)中,僵尸状态一直不退出,那么PCB就一直需要进行维护。
(3)若是一个父进程创建了很多子进程,但都不进行回收,那么就会造成资源浪费,因为数据结构对象本身就要占用内存。
(4)僵尸进程申请的资源无法进行回收,那么僵尸进程越多,实际可用的资源就越少,也就是说,僵尸进程会导致内存泄漏。

8.2 孤儿进程

  在Linux当中的进程关系大多数是父子关系,若子进程先退出而父进程没有对子进程的退出信息进行读取,那么我们称该进程为僵尸进程。但若是父进程先退出,那么将来子进程进入僵尸状态时就没有父进程对其进行处理,此时该子进程就称之为孤儿进程。
  若是一直不处理孤儿进程的退出信息,那么孤儿进程就会一直占用资源,此时就会造成内存泄漏。因此,当出现孤儿进程的时候,孤儿进程会被1号init进程(系统本身)领养,此后当孤儿进程进入僵尸状态时就由init进程进行处理回收。
在这里插入图片描述
在这里插入图片描述

  为什么要被领养
未来子进程退出的时候,父进程早已不在,需要领养进程来进行回收。

  • 36
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值