浅谈Linux下的task_struct

Linux下的task_struct 即是windows操作系统下的进程控制块(PCB),今天我们来看一下task_struct 下都有什么吧!

上篇博客我们谈到task_struct中描述了以下信息:

标识符:与进程相关的唯一标识符,用来区别正在执行的进程和其他进程。
状态:描述进程的状态,因为进程有挂起,阻塞,运行等好几个状态,所以都有个标识符来记录进程的执行状态。
优先级:如果有好几个进程正在执行,就涉及到进程被执行的先后顺序的问题,这和进程优先级这个标识符有关。
程序计数器:程序中即将被执行的下一条指令的地址。
内存指针:程序代码和进程相关数据的指针。
上下文数据:进程执行时处理器的寄存器中的数据。
I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表等。
记账信息:包括处理器的时间总和,记账号等等。

今天我们来仔细剖析一下这些信息。

 进程标识符

pid_t pid;     //进程的标识符
pid_t tgid;    //线程组标识符
unsigned int flags; /* per process flags, defined below */ 
1
flags反应进程的状态信息,用于内核识别当前进程的状态。

它的取值范围如下:

 /*
* Per process flags
*/
#define PF_EXITING      0x00000004      /* getting shut down */
#define PF_EXITPIDONE   0x00000008      /* pi exit done on shut down */
#define PF_VCPU         0x00000010      /* I'm a virtual CPU */
#define PF_WQ_WORKER    0x00000020      /* I'm a workqueue worker */
#define PF_FORKNOEXEC   0x00000040      /* forked but didn't exec */
#define PF_MCE_PROCESS  0x00000080      /* process policy on mce errors */
#define PF_SUPERPRIV    0x00000100      /* used super-user privileges */
#define PF_DUMPCORE     0x00000200      /* dumped core */
#define PF_SIGNALED     0x00000400      /* killed by a signal */
#define PF_MEMALLOC     0x00000800      /* Allocating memory */
#define PF_NPROC_EXCEEDED 0x00001000    /* set_user noticed that RLIMIT_NPROC was exceeded */
#define PF_USED_MATH    0x00002000      /* if unset the fpu must be initialized before use */
#define PF_USED_ASYNC   0x00004000      /* used async_schedule*(), used by module init */
#define PF_NOFREEZE     0x00008000      /* this thread should not be frozen */
#define PF_FROZEN       0x00010000      /* frozen for system suspend */
#define PF_FSTRANS      0x00020000      /* inside a filesystem transaction */
#define PF_KSWAPD       0x00040000      /* I am kswapd */
#define PF_MEMALLOC_NOIO 0x00080000     /* Allocating memory without IO involved */
#define PF_LESS_THROTTLE 0x00100000     /* Throttle me less: I clean memory */
#define PF_KTHREAD      0x00200000      /* I am a kernel thread */
#define PF_RANDOMIZE    0x00400000      /* randomize virtual address space */
#define PF_SWAPWRITE    0x00800000      /* Allowed to write to swap */
#define PF_NO_SETAFFINITY 0x04000000    /* Userland is not allowed to meddle with cpus_allowed */
#define PF_MCE_EARLY    0x08000000      /* Early kill for mce process policy */
#define PF_MUTEX_TESTER 0x20000000      /* Thread belongs to the rt mutex tester */
#define PF_FREEZER_SKIP 0x40000000      /* Freezer should not count it as freezable */
#define PF_SUSPEND_TASK 0x80000000      /* this thread called freeze_processes and should not 

在这其中,我们来看一下常用标记

进程亲属关系

struct task_struct *real_parent; /* real parent process */  
struct task_struct *parent; /* recipient of SIGCHLD, wait4() reports */  
struct list_head children;    /* list of my children */  
struct list_head sibling;    /* linkage in my parent's children list */  
struct task_struct *group_leader;    /* threadgroup leader */  

进程状态

volatile long state ,state的取值如下:

<strong>#define TASK_RUNNING        0//进程要么正在执行,要么准备执行  
#define TASK_INTERRUPTIBLE  1 //可中断的睡眠,可以通过一个信号唤醒  
#define TASK_UNINTERRUPTIBLE    2 //不可中断睡眠,不可以通过信号进行唤醒  
#define __TASK_STOPPED      4 //进程停止执行  
#define __TASK_TRACED       8 //进程被追踪  
/* in tsk->exit_state */   
#define EXIT_ZOMBIE     16 //僵尸状态的进程,表示进程被终止,但是父进程还没有获取它的终止信息,比如进程有没有执行完等信息。                       
#define EXIT_DEAD       32 //进程的最终状态,进程死亡  
/* in tsk->state again */   
#define TASK_DEAD       64 //死亡  
#define TASK_WAKEKILL       128 //唤醒并杀死的进程  
#define TASK_WAKING     256 //唤醒进程</strong>  

进程的调度信息

int prio, static_prio, normal_prio;
unsigned int rt_priority;

进程的调度策略

#define SCHED_NORMAL        0//按照优先级进行调度(有些地方也说是CFS调度器)  
#define SCHED_FIFO        1//先进先出的调度算法  
#define SCHED_RR        2//时间片轮转的调度算法  
#define SCHED_BATCH        3//用于非交互的处理机消耗型的进程  
#define SCHED_IDLE        5//系统负载很低时的调度算法  
#define SCHED_RESET_ON_FORK     0x40000000  

进程地址空间

struct mm_struct *mm, *active_mm;
/* per-thread vma caching */
u32 vmacache_seqnum;
struct vm_area_struct *vmacache[VMACACHE_SIZE];
#if defined(SPLIT_RSS_COUNTING)
struct task_rss_stat    rss_stat;
#endif

/*  http://lxr.free-electrons.com/source/include/linux/sched.h?V=4.5#L1484  */
#ifdef CONFIG_COMPAT_BRK
unsigned brk_randomized:1;

#endif

时间数据成员

       一个进程从创建到终止叫做该进程的生存期,进程在其生存期内使用CPU时间,内核都需要进行记录,进程耗费的时间分为两部分,一部分是用户模式下耗费的时间,一部分是在系统模式下耗费的时间.

cputime_t utime, stime, utimescaled, stimescaled;  
    cputime_t gtime;  
    cputime_t prev_utime, prev_stime;//记录当前的运行时间(用户态和内核态)  
    unsigned long nvcsw, nivcsw; //自愿/非自愿上下文切换计数  
    struct timespec start_time;  //进程的开始执行时间      
    struct timespec real_start_time;  //进程真正的开始执行时间  
    unsigned long min_flt, maj_flt;  
    struct task_cputime cputime_expires;//cpu执行的有效时间  
    struct list_head cpu_timers[3];//用来统计进程或进程组被处理器追踪的时间  
    struct list_head run_list;  
    unsigned long timeout;//当前已使用的时间(与开始时间的差值)  
    unsigned int time_slice;//进程的时间片的大小  
    int nr_cpus_allowed;  

信号处理信息

struct signal_struct *signal;//指向进程信号描述符  
    struct sighand_struct *sighand;//指向进程信号处理程序描述符  
    sigset_t blocked, real_blocked;//阻塞信号的掩码  
    sigset_t saved_sigmask;    /* restored if set_restore_sigmask() was used */  
    struct sigpending pending;//进程上还需要处理的信号  
    unsigned long sas_ss_sp;//信号处理程序备用堆栈的地址  
    size_t sas_ss_size;//信号处理程序的堆栈的地址  

文件系统信息

/* filesystem information */  
    struct fs_struct *fs;//文件系统的信息的指针  
/* open file information */  
    struct files_struct *files;//打开文件的信息指针  

Ptrace 系统调用

Ptrace 用来控制子进程的运行,常用来进行断点调试,当它被设置为0时不需要追踪。

<strong>/* linux-2.6.38.8/include/linux/ptrace.h */    
#define PT_PTRACED  0x00000001    
#define PT_DTRACE   0x00000002  /* delayed trace (used on m68k, i386) */    
#define PT_TRACESYSGOOD 0x00000004    
#define PT_PTRACE_CAP   0x00000008  /* ptracer can follow suid-exec */    
#define PT_TRACE_FORK   0x00000010    
#define PT_TRACE_VFORK  0x00000020    
#define PT_TRACE_CLONE  0x00000040    
#define PT_TRACE_EXEC   0x00000080    
#define PT_TRACE_VFORK_DONE 0x00000100    
#define PT_TRACE_EXIT   0x00000200  </strong>  
<strong>unsigned int ptrace;    
struct list_head ptraced;    
struct list_head ptrace_entry;    
unsigned long ptrace_message;    
siginfo_t *last_siginfo;      /* For ptrace use.  */    
ifdef CONFIG_HAVE_HW_BREAKPOINT    
atomic_t ptrace_bp_refcnt;    
endif  </strong>  

task_struct 的定义及注释

struct task_struct {  
volatile long state;  //说明了该进程是否可以执行,还是可中断等信息  
unsigned long flags;  //Flage 是进程号,在调用fork()时给出  
int sigpending;    //进程上是否有待处理的信号  
mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同  
                        //0-0xBFFFFFFF for user-thead  
                        //0-0xFFFFFFFF for kernel-thread  
//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度  
volatile long need_resched;  
int lock_depth;  //锁深度  
long nice;       //进程的基本时间片  
//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER  
unsigned long policy;  
struct mm_struct *mm; //进程内存管理信息  
int processor;  
//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新  
unsigned long cpus_runnable, cpus_allowed;  
struct list_head run_list; //指向运行队列的指针  
unsigned long sleep_time;  //进程的睡眠时间  
//用于将系统中所有的进程连成一个双向循环链表, 其根是init_task  
struct task_struct *next_task, *prev_task;  
struct mm_struct *active_mm;  
struct list_head local_pages;       //指向本地页面        
unsigned int allocation_order, nr_local_pages;  
struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式  
int exit_code, exit_signal;  
int pdeath_signal;     //父进程终止时向子进程发送的信号  
unsigned long personality;  
//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序  
int did_exec:1;   
pid_t pid;    //进程标识符,用来代表一个进程  
pid_t pgrp;   //进程组标识,表示进程所属的进程组  
pid_t tty_old_pgrp;  //进程控制终端所在的组标识  
pid_t session;  //进程的会话标识  
pid_t tgid;  
int leader;     //表示进程是否为会话主管  
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;  
struct list_head thread_group;   //线程链表  
struct task_struct *pidhash_next; //用于将进程链入HASH表  
struct task_struct **pidhash_pprev;  
wait_queue_head_t wait_chldexit;  //供wait4()使用  
struct completion *vfork_done;  //供vfork() 使用  
unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值  
  
//it_real_value,it_real_incr用于REAL定时器,单位为jiffies, 系统根据it_real_value  
//设置定时器的第一个终止时间. 在定时器到期时,向进程发送SIGALRM信号,同时根据  
//it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。  
//当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送  
//信号SIGPROF,并根据it_prof_incr重置时间.  
//it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种  
//状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据  
//it_virt_incr重置初值。  
unsigned long it_real_value, it_prof_value, it_virt_value;  
unsigned long it_real_incr, it_prof_incr, it_virt_value;  
struct timer_list real_timer;   //指向实时定时器的指针  
struct tms times;      //记录进程消耗的时间  
unsigned long start_time;  //进程创建的时间  
//记录进程在每个CPU上所消耗的用户态时间和核心态时间  
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];   
//内存缺页和交换信息:  
//min_flt, maj_flt累计进程的次缺页数(Copy on Write页和匿名页)和主缺页数(从映射文件或交换  
//设备读入的页面数); nswap记录进程累计换出的页面数,即写到交换设备上的页面数。  
//cmin_flt, cmaj_flt, cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。  
//在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中  
unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;  
int swappable:1; //表示进程的虚拟地址空间是否允许换出  
//进程认证信息  
//uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid  
//euid,egid为有效uid,gid  
//fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件  
//系统的访问权限时使用他们。  
//suid,sgid为备份uid,gid  
uid_t uid,euid,suid,fsuid;  
gid_t gid,egid,sgid,fsgid;  
int ngroups; //记录进程在多少个用户组中  
gid_t groups[NGROUPS]; //记录进程所在的组  
//进程的权能,分别是有效位集合,继承位集合,允许位集合  
kernel_cap_t cap_effective, cap_inheritable, cap_permitted;  
int keep_capabilities:1;  
struct user_struct *user;  
struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息  
unsigned short used_math;   //是否使用FPU  
char comm[16];   //进程正在运行的可执行文件名  
 //文件系统信息  
int link_count, total_link_count;  
//NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空  
struct tty_struct *tty;  
unsigned int locks;  
//进程间通信信息  
struct sem_undo *semundo;  //进程在信号灯上的所有undo操作  
struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作  
//进程的CPU状态,切换时,要保存到停止进程的task_struct中  
struct thread_struct thread;  
  //文件系统信息  
struct fs_struct *fs;  
  //打开文件信息  
struct files_struct *files;  
  //信号处理函数  
spinlock_t sigmask_lock;  
struct signal_struct *sig; //信号处理函数  
sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位  
struct sigpending pending;  //进程上是否有待处理的信号  
unsigned long sas_ss_sp;  
size_t sas_ss_size;  
int (*notifier)(void *priv);  
void *notifier_data;  
sigset_t *notifier_mask;  
u32 parent_exec_id;  
u32 self_exec_id;  
  
spinlock_t alloc_lock;  
void *journal_info;  
};  volatile long state;  //说明了该进程是否可以执行,还是可中断等信息  
unsigned long flags;  //Flage 是进程号,在调用fork()时给出  
int sigpending;    //进程上是否有待处理的信号  
mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同  
                        //0-0xBFFFFFFF for user-thead  
                        //0-0xFFFFFFFF for kernel-thread  
//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度  
volatile long need_resched;  
int lock_depth;  //锁深度  
long nice;       //进程的基本时间片  
//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER  
unsigned long policy;  
struct mm_struct *mm; //进程内存管理信息  
int processor;  
//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新  
unsigned long cpus_runnable, cpus_allowed;  
struct list_head run_list; //指向运行队列的指针  
unsigned long sleep_time;  //进程的睡眠时间  
//用于将系统中所有的进程连成一个双向循环链表, 其根是init_task  
struct task_struct *next_task, *prev_task;  
struct mm_struct *active_mm;  
struct list_head local_pages;       //指向本地页面        
unsigned int allocation_order, nr_local_pages;  
struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式  
int exit_code, exit_signal;  
int pdeath_signal;     //父进程终止时向子进程发送的信号  
unsigned long personality;  
//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序  
int did_exec:1;   
pid_t pid;    //进程标识符,用来代表一个进程  
pid_t pgrp;   //进程组标识,表示进程所属的进程组  
pid_t tty_old_pgrp;  //进程控制终端所在的组标识  
pid_t session;  //进程的会话标识  
pid_t tgid;  
int leader;     //表示进程是否为会话主管  
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;  
struct list_head thread_group;   //线程链表  
struct task_struct *pidhash_next; //用于将进程链入HASH表  
struct task_struct **pidhash_pprev;  
wait_queue_head_t wait_chldexit;  //供wait4()使用  
struct completion *vfork_done;  //供vfork() 使用  
unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值  
  
//it_real_value,it_real_incr用于REAL定时器,单位为jiffies, 系统根据it_real_value  
//设置定时器的第一个终止时间. 在定时器到期时,向进程发送SIGALRM信号,同时根据  
//it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。  
//当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送  
//信号SIGPROF,并根据it_prof_incr重置时间.  
//it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种  
//状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据  
//it_virt_incr重置初值。  
unsigned long it_real_value, it_prof_value, it_virt_value;  
unsigned long it_real_incr, it_prof_incr, it_virt_value;  
struct timer_list real_timer;   //指向实时定时器的指针  
struct tms times;      //记录进程消耗的时间  
unsigned long start_time;  //进程创建的时间  
//记录进程在每个CPU上所消耗的用户态时间和核心态时间  
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];   
//内存缺页和交换信息:  
//min_flt, maj_flt累计进程的次缺页数(Copy on Write页和匿名页)和主缺页数(从映射文件或交换  
//设备读入的页面数); nswap记录进程累计换出的页面数,即写到交换设备上的页面数。  
//cmin_flt, cmaj_flt, cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。  
//在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中  
unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;  
int swappable:1; //表示进程的虚拟地址空间是否允许换出  
//进程认证信息  
//uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid  
//euid,egid为有效uid,gid  
//fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件  
//系统的访问权限时使用他们。  
//suid,sgid为备份uid,gid  
uid_t uid,euid,suid,fsuid;  
gid_t gid,egid,sgid,fsgid;  
int ngroups; //记录进程在多少个用户组中  
gid_t groups[NGROUPS]; //记录进程所在的组  
//进程的权能,分别是有效位集合,继承位集合,允许位集合  
kernel_cap_t cap_effective, cap_inheritable, cap_permitted;  
int keep_capabilities:1;  
struct user_struct *user;  
struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息  
unsigned short used_math;   //是否使用FPU  
char comm[16];   //进程正在运行的可执行文件名  
 //文件系统信息  
int link_count, total_link_count;  
//NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空  
struct tty_struct *tty;  
unsigned int locks;  
//进程间通信信息  
struct sem_undo *semundo;  //进程在信号灯上的所有undo操作  
struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作  
//进程的CPU状态,切换时,要保存到停止进程的task_struct中  
struct thread_struct thread;  
  //文件系统信息  
struct fs_struct *fs;  
  //打开文件信息  
struct files_struct *files;  
  //信号处理函数  
spinlock_t sigmask_lock;  
struct signal_struct *sig; //信号处理函数  
sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位  
struct sigpending pending;  //进程上是否有待处理的信号  
unsigned long sas_ss_sp;  
size_t sas_ss_size;  
int (*notifier)(void *priv);  
void *notifier_data;  
sigset_t *notifier_mask;  
u32 parent_exec_id;  
u32 self_exec_id;  
  
spinlock_t alloc_lock;  
void *journal_info;  
};  

 

 

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值