Linux下进程及其描述task_struct

在谈进程之前,我们先说一说程序:在Linux下,我们想生成一个C程序,必定要通过预处理,编译,汇编,链接这四步,才能得到一个可执行文件也就是我们的C程序,而对于我们操作系统而言,要运行一个磁盘上保存的二进制可执行文件,要进行哪些操作呢?

根据冯诺依曼体系结构,我们知道我们的CPU其实只跟我们的内存打交道,而在这里我们要让CPU运行我们的二进制可执行文件,就必然要将磁盘上的二进制文件加载到我们的内存当中,而当这份二进制文件被加载到内存当中后,就不仅仅是单纯的二进制可执行文件这么简单,程序在这里就会演变成为我们所说的进程。

而对于进程,除了包含之前的二进制文件中的数据与代码以外,还有一项非常重要的内容,也就是我们的进程控制块PCB(在Linux下PCB就是task_struct的结构体),而在进程控制块当中,则是包含所有描述该进程的信息,所以我们操作系统对于进程的管理主要通过两个方面:

1.内核将磁盘上的二进制可执行文件读入到内存当中,并且为其分配对应的内存空间;

2.内核为这个进程保存所有相关信息,构建PCB(task_struct结构体),并将其与其他进程的PCB以特定的数据结构管理组织管理起来;

这样一来,我们操作系统的调度程序就可以根据对应的PCB找到对应的进程,就可以对其所管辖的进程进行调度执行了。

对于上述的两个方面,首先我们来讨论一下第一个,也就是内核将磁盘上的二进制文件读入到内存当中,这里就会形成对应的内存映像,而对于二进制可执行程序与进程的内存映像的不同之处在于:

1.二进制可执行程序在于硬盘之中,而进程的内存映像在于内存当中;

2.二进制可执行程序并不存在堆栈,只有当其被加载到内存当中后才会被分配堆栈;

3.二进制可执行程序虽然也有未初始化的数据段,但它并不被存储在硬盘中的可执行文件当中;

4.二进制可执行程序是静态的,而我们的进程的内存映像是动态的,随时变化的;

而进程的内存映像的大致布局如下(也就是我们所说的地址空间):


由此我们可以总结出:硬盘上的二进制可执行程序在被加载到内存当中,其中的数据以及代码就保存在这个进程所对应的地址空间当中,而这个地址空间上的所有地址均为虚拟地址,至于它与我们物理内存的关系,则是地址空间上的虚拟地址通过页表以及CPU上的内存管理单元MMU这一硬件将虚拟地址通过映射,将其转化成我们的物理地址。

我们操作系统内核在管理进程主要是通过对每个进程的PCB进行管理,而一个PCB中包含了这个进程的所有信息,而这些信息大致有哪些呢?(我们以Linux的task_struct为例)

在进行剖析task_struct的定义之前,我们先按照我们的理论推一下它的结构:
1、进程状态 ,将纪录进程在等待,运行,或死锁
2、调度信息, 由哪个调度函数调度,怎样调度等
3、进程的通讯状况
4、因为要插入进程树,必须有联系父子兄弟的指针, 当然是task_struct型
5、时间信息, 比如计算好执行的时间, 以便cpu 分配
6、标号 ,决定改进程归属
7、可以读写打开的一些文件信息
8、 进程上下文和内核上下文
9、处理器上下文
10、内存信息

查看task_struct这个结构体定义的源码可以通过/usr/src/kernels/2.6.32-431.el6.i686/include/linux这个路径,去查找其中的sched.h文件,其中大致定义如下:

struct task_struct {
volatile long state;  //说明了该进程是否可以执行,还是可中断等信息
unsigned long flags;  //Flage 是进程号,在调用fork()时给出
int sigpending;    //进程上是否有待处理的信号
mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同
                        //0-0xBFFFFFFF for user-thead
                        //0-0xFFFFFFFF for kernel-thread
//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
volatile long need_resched;
int lock_depth;  //锁深度
long nice;       //进程的基本时间片
//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER
unsigned long policy;
struct mm_struct *mm; //进程内存管理信息
int processor;
//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新
unsigned long cpus_runnable, cpus_allowed;
struct list_head run_list; //指向运行队列的指针
unsigned long sleep_time;  //进程的睡眠时间
//用于将系统中所有的进程连成一个双向循环链表, 其根是init_task
struct task_struct *next_task, *prev_task;
struct mm_struct *active_mm;
struct list_head local_pages;       //指向本地页面      
unsigned int allocation_order, nr_local_pages;
struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式
int exit_code, exit_signal;
int pdeath_signal;     //父进程终止是向子进程发送的信号
unsigned long personality;
//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序
int did_exec:1; 
pid_t pid;    //进程标识符,用来代表一个进程
pid_t pgrp;   //进程组标识,表示进程所属的进程组
pid_t tty_old_pgrp;  //进程控制终端所在的组标识
pid_t session;  //进程的会话标识
pid_t tgid;
int leader;     //表示进程是否为会话主管
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;
struct list_head thread_group;   //线程链表
struct task_struct *pidhash_next; //用于将进程链入HASH表
struct task_struct **pidhash_pprev;
wait_queue_head_t wait_chldexit;  //供wait4()使用
struct completion *vfork_done;  //供vfork() 使用
unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值
 
//it_real_value,it_real_incr用于REAL定时器,单位为jiffies, 系统根据it_real_value
//设置定时器的第一个终止时间. 在定时器到期时,向进程发送SIGALRM信号,同时根据
//it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。
//当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送
//信号SIGPROF,并根据it_prof_incr重置时间.
//it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种
//状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据
//it_virt_incr重置初值。
unsigned long it_real_value, it_prof_value, it_virt_value;
unsigned long it_real_incr, it_prof_incr, it_virt_value;
struct timer_list real_timer;   //指向实时定时器的指针
struct tms times;      //记录进程消耗的时间
unsigned long start_time;  //进程创建的时间
//记录进程在每个CPU上所消耗的用户态时间和核心态时间
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS]; 
//内存缺页和交换信息:
//min_flt, maj_flt累计进程的次缺页数(Copy on Write页和匿名页)和主缺页数(从映射文件或交换
//设备读入的页面数); nswap记录进程累计换出的页面数,即写到交换设备上的页面数。
//cmin_flt, cmaj_flt, cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。
//在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中
unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
int swappable:1; //表示进程的虚拟地址空间是否允许换出
//进程认证信息
//uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid
//euid,egid为有效uid,gid
//fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件
//系统的访问权限时使用他们。
//suid,sgid为备份uid,gid
uid_t uid,euid,suid,fsuid;
gid_t gid,egid,sgid,fsgid;
int ngroups; //记录进程在多少个用户组中
gid_t groups[NGROUPS]; //记录进程所在的组
//进程的权能,分别是有效位集合,继承位集合,允许位集合
kernel_cap_t cap_effective, cap_inheritable, cap_permitted;
int keep_capabilities:1;
struct user_struct *user;
struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息
unsigned short used_math;   //是否使用FPU
char comm[16];   //进程正在运行的可执行文件名
 //文件系统信息
int link_count, total_link_count;
//NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空
struct tty_struct *tty;
unsigned int locks;
//进程间通信信息
struct sem_undo *semundo;  //进程在信号灯上的所有undo操作
struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作
//进程的CPU状态,切换时,要保存到停止进程的task_struct中
struct thread_struct thread;
  //文件系统信息
struct fs_struct *fs;
  //打开文件信息
struct files_struct *files;
  //信号处理函数
spinlock_t sigmask_lock;
struct signal_struct *sig; //信号处理函数
sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位
struct sigpending pending;  //进程上是否有待处理的信号
unsigned long sas_ss_sp;
size_t sas_ss_size;
int (*notifier)(void *priv);
void *notifier_data;
sigset_t *notifier_mask;
u32 parent_exec_id;
u32 self_exec_id;

spinlock_t alloc_lock;
void *journal_info;
};

以上内容我是参考了http://blog.sina.com.cn/s/blog_65403f9b0100gs3a.html这篇博客。

而其中几个重要的成员如下:

标示符 pid: 描述本进程的唯一标示符,用来区别其他进程。(通过系统调用getpid()与getppid()可以分别获取当前进程pid与其父进程pid,这里要注意一点:所有通过命令行进行的进程,其父进程均为shell)
状态 :任务状态,退出代码,退出信号等。
优先级 :相对于其他进程的优先级。
程序计数器:程序中即将被执行的下一条指令的地址。
内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据:进程执行时处理器的寄存器中的数据。
I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。

还有这里不得不提的一项就是mmstruct这个结构体,在上面的源码中也有相关定义:

struct mm_struct *mm; //进程内存管理信息
其实,mmstruct这个结构体主要描述了Linux视角下管理进程地址空间的信息,它主要通过以对应的start和end两个数据来对地址空间中的每一个区域进行对应的划分其范围。


最后附上一张图:




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值