文章目录
进程的定义
进程的创建
进程的退出
Task_struct 结构
Task_struct
这里不讲进程的基本原理,重点描述下进程的数据结构(task_struct).
进程的定义
正在执行的程序
正在计算机上执行的程序实例
能分配给处理器并有处理器执行的实体
一组指令序列的执行、一个当前状态个相关的系统自愿集
在进程执行时,任意给定一个时间,进程都可以唯一地被表征为以下元素:
标识符: 跟这个进程相关的唯一标识符,用来区别其他进程
状态: 进程的几个状态(等待、运行、停止)
优先级: 进程的优先级
程序计数器: 程序中即将被执行的下一条指令的地址。
内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。
上下文数据:进程执行时处理器的寄存器中的数据。
I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
这些所有的信息都存放在一个进程的数据结构中task_struct, 也叫PCB。每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体. 它在进程的运行时会被加载到RAM中。
相关视频
音视频该如何进阶?怎么学习音视频开发?FFmpeg/webRTC/rtmp/hls/rtsp/ffplay/srs
进程的创建
unix中进程创建是通过内核系统调用fork()实现的,当一个进程产生fork()请求时,操作系统执行以下功能:
为新进程在进程表中分配一个空项;
为子进程赋予一个唯一的进程标识符
给进程分配空间,做一个父进程上下文的逻辑副本,不包括共享内存区;
初始化进程控制块
增加父进程拥有的所有文件的计数器
把子进程置为就绪态
向父进程返回子进程的进程号;对子进程返回0;
设置正确的连接,把新进程放置在就绪/挂起链表中。
传统的UNIX中用于复制进程的系统调用是fork。 但它并不是Linux为此实现的唯一调用,实际上Linux实现了3个。
fork是重量级调用, 因为它建立了父进程的一个完整副本, 然后作为子进程执行。为减少与该调用相关的工作量, Linux使用了写时复制(copy-on-write) 技术。
vfork类似于fork, 但并不创建父进程数据的副本。 相反, 父子进程之间共享数据。这节省了大量CPU时间(如果一个进程操纵共享数据, 则另一个会自动注意到) 。
clone产生线程, 可以对父子进程之间的共享、 复制进行精确控制。
写时复制: 内核使用了写时复制(Copy-On-Write, COW) 技术, 以防止在fork执行时将父进程的所有数据复制到子进程。 在调用fork时, 内核通常对父进程的每个内存页, 都为子进程创建一个相同的副本。
执行系统调用 : fork、 vfork和clone系统调用的入口点分别是sys_fork、 sys_vfork和sys_clone函数。 其定义依赖于具体的体系结构, 因为在用户空间和内核空间之间传递参数的方法因体系结构而异。
do_fork实现 : 所有3个fork机制最终都调用kernel/fork.c中的do_fork(一个体系结构无关的函数) , 其代码流程如图所示 :
音视频免费学习地址:FFmpeg/WebRTC/RTMP/NDK/Android音视频流媒体高级开发
分享一些比较好的学习书籍、视频资料共享在群文件里面,有需要的可以自行领取!~点击788280672加入自取(或联系管理员领取最新资料)。
进程的退出
进程必须用exit系统调用终止。 这使得内核有机会将该进程使用的资源释放回系统。 见kernel/exit.c------>do_exit。 简而言之,该函数的实现就是将各个引用计数器减1, 如果引用计数器归0而没有进程再使用对应的结构, 那么将相应的内存区域返还给内存管理模块;
Task_struct 结构
Linux内核涉及进程和程序的所有算法都围绕一个名为task_struct的数据结构建立, 该结构定义在include/linux/sched.h中。 这是系统中主要的一个结构:
进程的状态
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
state的可能取值为:
#define TASK_RUNNING 0//进程要么正在执行,要么准备执行
#define TASK_INTERRUPTIBLE 1 //可中断的睡眠,可以通过一个信号唤醒
#define TASK_UNINTERRUPTIBLE 2 //不可中断睡眠,不可以通过信号进行唤醒
#define __TASK_STOPPED 4 //进程停止执行
#define __TASK_TRACED 8 //进程被追踪
/* in tsk->exit_state */
#define EXIT_ZOMBIE 16 //僵尸状态的进程,表示进程被终止,但是父进程还没有获取它的终止信息,比如进程有没有执行完等信息。
#define EXIT_DEAD 32 //进程的最终状态,进程死亡
/* in tsk->state again */
#define TASK_DEAD 64 //死亡
#define TASK_WAKEKILL 128 //唤醒并杀死的进程
#define TASK_WAKING 256 //唤醒进程
进程的唯一标识(pid)
pid_t pid;//进程的唯一标识
pid_t tgid;// 线程组的领头线程的pid成员的值
在Linux系统中,一个线程组中的所有线程使用和该线程组的领头线程(该组中的第一个轻量级进程)相同的PID,并被存放在tgid成员中。只有线程组的领头线程的pid成员才会被设置为与tgid相同的值。注意,getpid()系统调用返回的是当前进程的tgid值而不是pid值。(线程是程序运行的最小单位,进程是程序运行的基本单位。)
进程的标记:
unsigned int flags; //flags成员的可能取值如下
#define PF_ALIGNWARN 0x00000001 /* Print alignment warning msgs */
/* Not implemented yet, only for 486*/
#define PF_STARTING 0x00000002 /* being created */
#define PF_EXITING 0x00000004 /* getting shut down */
#define PF_EXITPIDONE 0x00000008 /* pi exit done on shut down */
#define PF_VCPU 0x00000010 /* I'm a virtual CPU */
#define PF_FORKNOEXEC 0x00000040 /* forked but didn't exec */
#define PF_MCE_PROCESS 0x00000080 /* process policy on mce errors */
#define PF_SUPERPRIV 0x00000100 /* used super-user privileges */
#define PF_DUMPCORE