基本概念
课本概念:程序的一个执行实例,正在执行的程序等
内核观点:担当分配系统资源(CPU时间,内存)的实体。
描述进程-PCB
进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
课本上称之为PCB(process control block),Linux操作系统下的PCB是: task_struct。
系统中同时存在着大量的进程,使用ps aux指令就能显示当前系统中存在的进程。
那么,进程是由谁来管理的呢?当然是操作系统!这里就不得不提到管理的6字真言呢:先描述再组织。操作系统会对出现的进程进行描述,将进程的所有属性统一起来,之后对该进程的管理实际上就是对进程的属性信息的管理。进程信息被放在一个名叫进程控制块的数据结构中,简称PCB。操作系统将存在的每个进程都进行了描述,形成了一个个的PCB结构,再使用双链表的形式将每个PCB连接起来。这样一来,操作系统对进程的管理就变成了对该进程双链表的增、删、查、改等操作。
task_ struct内容分类
标示符: 描述本进程的唯一标示符,用来区别其他进程。
状态: 任务状态,退出代码,退出信号等。
优先级: 相对于其他进程的优先级。
程序计数器: 程序中即将被执行的下一条指令的地址。
内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
其他信息
查看进程
进程的信息可以通过/proc系统文件夹查看
如:要获取PID为1的进程信息,你需要查看/proc/1这个文件夹。
第二个方法则是使用前面提到的“ps aux”指令查看进程,ps命令与grep命令搭配使用,就可以只显示你想查看进程的信息。
通过系统调用创建进程-fork初识
fork函数是一个系统级别的函数,其功能是创建一个子进程。
例如,运行以下代码:
其代码运行结果为:
可以看出,fork函数有两个返回值,返回值为0时,进入子进程的执行区域,返回值为新创建的子进程PID时,进入父进程执行区域。那么,就会有人问呢,一个函数怎么会return两个返回值?这是因为当fork函数还没有结束时,子进程就已经出现了!也就是说,当fork函数还没有执行到其return代码时,就已经有了两个进程,这时return代码会执行两次。
Linux进程状态
一个进程从产生到消亡的过程中,其有时被处理器占有,有时可能会因为一些事情而导致不能执行等情况,这一切都说明了进程是有状态转换的,处于某个状态的进程,只能做相应的事。
让我们看看Linux的源代码中对进程状态怎么说:
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
注意:进程当前的状态时保存到自己的进程控制块中的。
在Linux中,我们可以使用ps aux指令去查看进程状态:
- R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里。
- S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠
- (interruptible sleep))。
- D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束。
- T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行。
注意:我们可以在Linux中使用kill -l命令查看系统的信号集:
- X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。
Z(zombie)-僵尸进程
- 僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程(使用wait()系统调用,后面讲)没有读取到子进程退出的返回代码时就会产生僵死(尸)进程
- 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。
- 所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态
- 僵尸状态的存在是非常有必要的,因为使用进程的目的就是用来完成你想要完成的某个任务,那么当任务完成时,你必须要知道你下达的任务到底处于什么情况,是成功了,还是失败了等等,总之,我必须要得到一个结果。所以,僵尸状态是必须存在的,这样才能让调用方得知任务的完成情况,以便进行后续相应的操作。
僵尸进程危害
- 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父进程如果一直不读取,那子进程就一直处于Z状态?是的!
- 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话说,Z状态一直不退出,PCB一直都要维护?是的!
- 那一个父进程创建了很多子进程,就是不回收,是不是就会造成内存资源的浪费?是的!因为数据结构对象本身就要占用内存,想想C中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空间!
- 僵尸进程申请的资源无法进行回收,那么僵尸进程越多,实际可用的资源就越来越少,也就是说,僵尸进程或导致内存的泄露。
孤儿进程
父进程如果提前退出,那么子进程后退出,进入Z之后,那该如何处理呢?
父进程先退出,子进程就称之为“孤儿进程”
孤儿进程被1号init进程领养,当然要有init进程回收喽。当然,这里的1号进程,也就是我们操作系统,前面也说了,当我们电脑开机时,打开的第一个进程也就是我们的操作系统。
进程优先级
基本概念
cpu资源分配的先后顺序,就是指进程的优先权(priority)。
优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用,可以改善系统性能。还可以把进程运行到指定的CPU上,这样一来,把不重要的进程安排到某个CPU,可以大大改善系统整体性能。
为什么要存在优先级?
为什么要存在优先级?这个原因我想非常容易理解,例如,一个人完成某件事的时候,会有轻重缓急,会考虑先做哪件事,后做哪件事,当然,我们的操作系统也是如此,毕竟我们的资源有限,处理器的个数肯定是比进程少的,所以,进程也必须存在优先级。
查看系统进程
在linux系统中,用ps –l命令则会类似输出以下几个内容:
- UID : 代表执行者的身份
- PID : 代表这个进程的代号
- PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号PRI :代表这个进程可被执行的优先级,其值越小越早被执行
- NI :代表这个进程的nice值
PRI and NI
- PRI就是进程的优先级,或者通俗点说就是程序被CPU执行的先后顺序,此值越小进程的优先级别越高
- 那NI呢?就是我们所要说的nice值了,其表示进程可被执行的优先级的修正数值
- PRI值越小越快被执行,那么加入nice值后,将会使得PRI变为:PRI(new)=PRI(old)+nice
- 这样,当nice值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行所以,调整进程优先级,在Linux下,就是调整进程nice值
- nice其取值范围是-20至19,一共40个级别。