初识进程1.0

进程

基本概念

  • 课本概念:程序的一个执行实例,正在执行的程序等
  • 内核观点:担当分配系统资源(CPU时间,内存)的实体。

自己的理解:

  1. 程序文件加载进内存后,就变成了进程
  2. 可执行程序与管理进程所需要的数据结构的集合

描述进程-PCB

  • 进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合。
  • 课本上称之为PCB(process control block), Linux操作系统下的PCB是: task_struct

task_struct——PCB的一种

  • 在Linux中描述进程的结构体叫做task_struct。
  • task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息。

task_ struct内容分类

  • 标识符: 描述本进程的唯一标识符,用来区别其他进程。
  • 状态: 任务状态,退出代码,退出信号等。
  • 优先级: 相对于其他进程的优先级。
  • 程序计数器: 程序中即将被执行的下一条指令的地址。
  • 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
  • 上下文数据: 进程执行时处理器的寄存器中的数据[休学例子,要加图CPU,寄存器]。
  • I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
  • 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
  • 其他信息

组织进程

可以在内核源代码里找到它。所有运行在系统里的进程都以task_struct链表的形式存在内核里。

查看进程

  1. 可以通过ps aux命令查看进程,如果我们想查看某个进程,就可以使用管道+grep,比如查看test,输入命令 ps aux | grep test即可

    写出下面这个程序

    #include <stdio.h>
    #include <unistd.h>
    int main()
    {
     //无限打印hello
     while(1)
     {
         printf("hello\n");
         sleep(1);
     }
    
    	return 0;
    }
    

    查看该进程信息:

    我们先运行程序,再通过复制会话执行ps aux | grep test ,就可以看到下列结果:
    image-20211001155933880

    ps aux是获取所有进程信息

    ps aux有多个选项,详情参见文章 ps aux 指令详解

  2. 进程的信息还可以通过 /proc 系统文件夹查看

    同样,我们可以通过上述进程的编号,查看进程

    先获取进程编号15228

    输入ls /proc

    image-20211001160809932

    进入进程15228:

    image-20211001160939872

    我们看到里面有一个进程的相关信息,简单解释一下圈出来的cwd,当我们创建文件没有指定路径时,就会默认在当前目录下创建,那操作系统怎么知道我们的当前目录呢,就是通过cwd来了解的

    上面/proc文件中的编号为1的进程可以理解为是操作系统进程,但实际上操作系统不是进程

通过系统调用获取进程标示符

  • 进程id(PID)
  • 父进程id(PPID)

获取当前进程编号及父进程编号

  • getpid() #获取当前进程编号
  • getppid() #获取父进程编号
#include<stdio.h>
#include <unistd.h>

int main()
{
  while (1)
  {
    printf("pid: %d ", getpid());
    printf("ppid: %d\n", getppid());
    sleep(1);
  }
  return 0;
}

image-20211001163129159

我们重复运行test程序,得到的进程编号都是不同的:

image-20211001163309991

但是,其父进程编号都是相同的,也就是说,父进程一直没有结束

image-20211001163606290

那么其父进程究竟是什么呢?

我们通过grep其进程编号6966来查看:

image-20211001163909558

父进程-bash

bash叫做命令行解释器,通过创建子进程,让子进程去完成对应的任务。

bash也是一个进程,bash是不能挂的

通过系统调用创建进程-fork初识

fork()可以创建一个子进程

  • fork有两个返回值

    父进程的fork 返回的是子进程的pid,子进程返回的是0

    如果fork失败了,返回值小于0

  • 父子进程代码共享,数据各自开辟空间,私有一份(采用写时拷贝)

  • 父子进程从fork执行相同的代码(只读)

#include <stdio.h>
#include <unistd.h>
int main( )
{
//在fork之前是一个进程
int ret = fork();
//fork之后是会进行分支执行的
printf(“hello proc : %d!, ret: %d\n”, getpid(), ret);
sleep(1);

return 0;

}


![image-20211002005924943](https://img-blog.csdnimg.cn/img_convert/7658a9728654a96acc2e6cdd3b9042e9.png)





* fork 之后通常要用 if 进行分流  

```c
#include <stdio.h>
#include <unistd.h>
int main()
{
    int ret = fork();
    if(ret < 0)
    {
        perror("fork");
        return 1;
    }
    else if(ret == 0)//child
    { 
    	printf("I am child : %d!, ret: %d\n", getpid(), ret);
    }
    else//father
    { 
    	printf("I am father : %d!, ret: %d\n", getpid(), ret);
    }

    sleep(1);
    return 0;
}

image-20211002010759052

理解进程创建

创建进程,是系统多了一个进程,多一个进程系统就要多一组管理进程的数据结构+该进程对应的代码和数据

fork父子执行顺序,及代码和数据复制的问题

父子执行顺序不一定,由调度器决定

进程数据 = 代码+数据

父进程创建子进程的时候,代码是共享的,数据是各自私有一份(写时拷贝)

代码是逻辑,一般是不可被修改的,也就是只可读
数据是既可读又可写的

通过数据私有,表现出进程具有独立性

fork为什么有两个返回值

fork函数执行的内容大概是给子进程的task_struct对象赋值等,最后返回pid

当fork执行完,子进程已创建完成,而父子进程都要使用fork,函数的返回值是数据,各自私有一份,所以返回的函数值不同

进程状态

看看Linux内核源代码怎么说

  • 为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态(在
    Linux内核里,进程有时候也叫做任务)。
    下面的状态在kernel源代码里定义:

    /*
    * The task state array is a strange "bitmap" of
    * reasons to sleep. Thus "running" is zero, and
    * you can test for combinations of others with
    * simple bit tests.
    */
    static const char * const task_state_array[] = {
    "R (running)", /* 0 */
    "S (sleeping)", /* 1 */
    "D (disk sleep)", /* 2 */
    "T (stopped)", /* 4 */
    "t (tracing stop)", /* 8 */
    "X (dead)", /* 16 */
    "Z (zombie)", /* 32 */
    };
    
    
  • R运行状态(running) : 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里。
    是R状态的进程,一定在CPU上面跑吗? 不一定,我们先了解:进程是分队列分配的,有运行队列,等待队列,阻塞队列(是等待队列的一种)
    R状态是指可以被调度,要么在运行,要么在运行队列里。

  • S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠
    (interruptible sleep))

我们看一个简单的代码:

 #include<stdio.h>
 #include<unistd.h>

 int main()
 {
     while (1)
    	{
     	printf("hello world\n");
     	sleep(1);
   	}

     return 0;
 }

当代码在死循环地打印时,我们查看test进程的状态:

image-20211002012026178

先不管S后面的 +是什么,我们看到S代表休眠,也就是该进程在等待,为什么呢,因为CPU比输出设备快多了,输出设备还在输出,CPU就没事做了,所以该进程一直在等待输出设备,而我们看到这么多次查看都是在S,说明等待时间占大部分时间。

再来讲讲 + 是什么意思,+表示当前进程在前台运行,可以用ctrl+c停下。如果我们想让其在后台运行,可以在 ./test后加上 &,此时就不能用ctrl + c停下了,而要用kill -9 [pid]

image-20211002013213204

  • D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束。

    关于D状态的解释

    当一个进程要从硬盘里面读取数据时(硬盘读取数据很慢),进程要等待硬盘(等待IO),硬盘需要查找数据,拷贝数据,都需要花费时间,而可能碰巧在进程等待的时候,计算机的内存已经不足了,此时操作系统为了管理内存,就会杀掉一些进程,而操作系统发现这个进程还在等待,操作系统就说:“内存都快没了,你还在这等什么。”于是,该进程就被操作系统给杀掉了,可硬盘还在查找数据,当它找到数据的时候,却尴尬地不知道把数据给谁。于是D状态就是保护这类的进程不被杀掉。

注意:D状态保证进程无法被杀掉,S状态可被杀掉

  • T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可
    以通过发送 SIGCONT 信号让进程继续运行。

我们可以写一个死循环程序,再使用相关命令使进程进入T状态:

  #include <stdio.h>
  #include <unistd.h>
  int main()
  {
    while (1)
    {
      printf("hello world\n");
      sleep(1);
    }
    return 0;
  }

输入kill -l查找使进程停下的选项

image-20211002014033537

使用效果:

image-20211002014240976

kill -18 24230 #使进程继续运行

image-20211002014705115

  • X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态

进程状态查看

ps aux / ps axj 命令

ps axj可以查看父进程编号

在这里插入图片描述

Z(zombie)-僵尸进程

  • 僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程(使用wait()系统调用,后面讲)
    没有读取到子进程退出的返回代码时就会产生僵死(尸)进程
  • 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。
  • 所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态

来一个创建僵死进程例子:

子进程打印五次结束运行,父进程一直运行:

#include <stdio.h>
#include<unistd.h>
#include <stdlib.h>
int main()
{
    
	pid_t ret = fork();
	if(ret < 0)
    {
		perror("fork");
		return 1;
  	}
	else if(ret > 0)//parent
    { 
        while (1)
        {
            printf("I am parent! pid is: %d\n", getpid());
			sleep(1);
        }
		
	}
    else
 	{
        int count = 0;
        while (count < 5)
        {
			printf("I am child! pid is: %d\n", getpid());
			sleep(2);
            ++count;	
        }
        
		exit(0);
	}
    
	return 0;
}

利用监控脚本来查看父子进程的信息:

while :; do ps axj | head -1 && ps axj | grep test | grep -v grep; sleep 1 ; echo “##############”; done

效果:

绿圆圈表示父进程状态
红方框表示子进程状态

当执行5次后,子进程就进入Z+(僵尸状态)了,而父进程还在运行

image-20211002020656275

运行效果:

image-20211002020846552

为什么有僵尸状态? 有什么特征

子进程结束,父进程需要检测子进程运行结束的结果:是否正常运行完?是否异常?发生了什么异常?

特征:一般处于僵尸状态时,task_struct是会被保留的,进程的退出信息,是放在进程控制块中的

僵尸进程危害

  • 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎
    么样了。可父进程如果一直不读取,那子进程就一直处于Z状态?是的!
  • 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话
    说, Z状态一直不退出, PCB一直都要维护?是的!
  • 那一个父进程创建了很多子进程,就是不回收,是不是就会造成内存资源的浪费?是的!因为数据结构
    对象本身就要占用内存,想想C中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空间!
  • 造成内存泄漏

孤儿进程

  • 父进程如果提前退出,那么子进程后退出,进入Z之后,那该如何处理呢?
  • 父进程先退出,子进程就称之为“孤儿进程”
  • 孤儿进程被1号进程领养,当然要由1号进程回收
#include <stdio.h>
#include<unistd.h>
#include <stdlib.h>
int main()
{
    
	pid_t ret = fork();
	if(ret < 0)
    {
		perror("fork");
		return 1;
  	}
	else if(ret > 0)//parent
    { 
        int count = 0;
        while (count < 5)
        {
            printf("I am parent! pid is: %d\n", getpid());
			sleep(1);
            ++count;	
        }
		
	}
    else
 	{
        while (1)
        {
            printf("I am child! pid is: %d\n", getpid());
			sleep(1);
        }
        
		exit(0);
	}
    
	return 0;
}

同样也可以用脚本观察父子进程的状态

父进程运行五次就结束了,子进程还在继续,且变成了后台运行

image-20211002022415860

运行效果:

image-20211002022102735

如果进程的父进程进入僵尸,该进程的资源(内存)就没有办法回收,造成内存泄漏

OS考虑了这个问题,孤儿进程是要被领养的,具体被1号进程领养

Linux中所有进程都有父进程,除了1号进程

  • 9
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 6
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WoLannnnn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值