task_struct 结构剖析

在之前我们提到的,每个进程都有一个特殊的数据结构 PCB(进程控制块)来对进程进行管理。
在 linux 中,task_struct 就是我们所说的 PCB。
PCB 是控制进程的唯一手段。

task_struct 内容大致可分为

 - 标示符 :描述被进程的唯一标识符,用来区别其他进程。
 - 状态 :任务状态,退出代码,退出信号等。
 - 优先级 :相对于其他进程的优先级。
 - 程序计数器 :程序中即将被执行的下一条指令的地址。
     - 内存指针 :包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。
     - 上下文数据 :进程执行时处理器的寄存器中的数据。
     - I/O 状态信息 :包括显示的 I/O 请求,分配给进程的 I/O 设备和被进程使用的文件列表。
     - 记账信息 :可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
     - 其他信息

内容剖析

struct task_struct {
    volatile long state;    /* -1 unrunnable, 0 runnable, >0 stopped */
    //进程运行时的状态  -1 表示无法运行     0  表示正在运行  >0 表示停止

    void *stack;
    //进程内核栈

    atomic_t usage;
    //原子操作

    unsigned int flags; /* per process flags, defined below */
    //  进程标志 进程当前的状态标志,但不是运行状态,用于内核识别进程当前的状态。

    unsigned int ptrace;
    // 系统调用
    // 提供父进程可以控制子进程运行,并检查和改变其狠心 image
    // 主要用于实现断点调试

    int lock_depth;     /* BKL lock depth */

#ifdef CONFIG_SMP
#ifdef __ARCH_WANT_UNLOCKED_CTXSW
    int oncpu; // 运行于哪个 CPU 上
#endif
#endif

    int prio, static_prio, normal_prio;
    // prio 表示动态优先级,根据 static_prio 和 交互性奖罚算出。
    // static_prio 进程的静态优先级,在进程创建时确定,范围在 -20~19越小优先级越高。
    // normal_prio的优先级取决于静态优先级和调度策略。

    unsigned int rt_priority;
    // 用于保存实时优先级,范围是 0~99


    const struct sched_class *sched_class;
    // 调度类
    struct sched_entity se;
    // 普通进程的调用实体,每个进程都有其中之一的实体
    struct sched_rt_entity rt;
    // 实时进程的调用实体,每个进程都有其中之一的实体

#ifdef CONFIG_PREEMPT_NOTIFIERS
    /* list of struct preempt_notifier: */
    struct hlist_head preempt_notifiers;
    // 抢占相关
#endif

    /*
     * fpu_counter contains the number of consecutive context switches
     * that the FPU is used. If this is over a threshold, the lazy fpu
     * saving becomes unlazy to save the trap. This is an unsigned char
     * so that after 256 times the counter wraps and the behavior turns
     * lazy again; this to deal with bursty apps that only use FPU for
     * a short time
     */
    unsigned char fpu_counter;
#ifdef CONFIG_BLK_DEV_IO_TRACE
    unsigned int btrace_seq;
#endif

    unsigned int policy;
     调度策略
    cpumask_t cpus_allowed;
    // 多核体系结构中管理 cpu 的位图

#ifdef CONFIG_TREE_PREEMPT_RCU
    // 锁机制
    int rcu_read_lock_nesting;
    char rcu_read_unlock_special;
    struct rcu_node *rcu_blocked_node;
    struct list_head rcu_node_entry;
#endif /* #ifdef CONFIG_TREE_PREEMPT_RCU */

#if defined(CONFIG_SCHEDSTATS) || defined(CONFIG_TASK_DELAY_ACCT)
    struct sched_info sched_info;
    // 调度相关的信息,
#endif

    struct list_head tasks;  // 任务队列
    struct plist_node pushable_tasks;

    struct mm_struct *mm, *active_mm;
    // mm 进程所拥有的用户空间内存描述符,内核线程为 NULL
    // active_mm 指向进程运行时所使用的内存描述符,对普通进程而言,这两个指针相同。
    // 但是内核线程是没有 mm 的,但是内核必须知道用户空间包含了什么
    // 因此内核线程的 active_mm 成员被初始化为前一个运行进程的 active_mm 值。


/* task state */

    // 判断标志
    int exit_state;
    // 退出时状态
    int exit_code, exit_signal;
    // 退出时发出的信号
    // exit_code 进程终止代号 要么是_exit()/exit_group() 系统调用参数,要么由内核提供错误代号。
    // exit_signal 被置为 -1 时表示是某个线程组中的一员。只有当线程组的最后一个成员终止时,才会产生一个信号,以通知线程组的领头进程的父进程。
    int pdeath_signal;  /*  The signal sent when the parent dies  */
    // 父进程死亡时发出的信号
    unsigned int personality;
    // 用于处理不同的 ABI
    unsigned did_exec:1;
    // 用于记录代码是否被 execve()函数所执行
    unsigned in_execve:1;   
    // 用于通知 LSM 是否被 do_execve()函数所调用
    unsigned in_iowait:1;
    // 用于判断是否进程 iowait 计数
    /* Revert to default priority/policy when forking */
    unsigned sched_reset_on_fork:1;

    pid_t pid; 
    //进程标识符,用于标识唯一进程。
    pid_t tgid;
    //线程组号

#ifdef CONFIG_CC_STACKPROTECTOR
    /* Canary value for the -fstack-protector gcc feature */
    unsigned long stack_canary;
#endif

    /* 
     * pointers to (original) parent process, youngest child, younger sibling,
     * older sibling, respectively.  (p->father can be replaced with 
     * p->real_parent->pid)
     */
    struct task_struct *real_parent; /* real parent process */
    // 进程的亲生父亲,如果父进程死亡,则指向 pid 为 1 的 init 进程内核栈

    struct task_struct *parent; /* recipient of SIGCHLD, wait4() reports */
    // 进程的父进程,进程终止时,向父进程发送信号 

    struct list_head children;  /* list of my children */
    // 链表的头部,链表中的所有元素都是它的子进程。

    struct list_head sibling;   /* linkage in my parent's children list */
    // 用于把当前进程插入到兄弟链表中。

    struct task_struct *group_leader;   /* threadgroup leader */
    // 指向其所在进程组的组长进程


    struct list_head ptraced;
    struct list_head ptrace_entry;

    /*
     * This is the tracer handle for the ptrace BTS extension.
     * This field actually belongs to the ptracer task.
     */
    struct bts_context *bts;

    /* PID/PID hash table linkage. */
    struct pid_link pids[PIDTYPE_MAX];
    struct list_head thread_group;

    struct completion *vfork_done;      /* for vfork() */
    int __user *set_child_tid;      /* CLONE_CHILD_SETTID */
    int __user *clear_child_tid;        /* CLONE_CHILD_CLEARTID */

    cputime_t utime, stime, utimescaled, stimescaled;
    // utime/stime 用于记录进程在用户态/内核态下所经过的节拍数
    // utimescaled/stimescaled 用于记录进程在用户态/内核态的运行时间,以处理器的频率为刻度
    cputime_t gtime;
    // 以节拍计数的虚拟机运行时间
    cputime_t prev_utime, prev_stime;
    // 先前的运行时间
    unsigned long nvcsw, nivcsw; /* context switch counts */
    // 自愿/非自愿上下文切换计数
    struct timespec start_time;         /* monotonic time */
    // 进程创建时间
    struct timespec real_start_time;    /* boot based time */
    // 进程创建时间
/* mm fault and swap info: this can arguably be seen as either mm-specific or thread-specific */
    unsigned long min_flt, maj_flt;
    // 缺页统计
    struct task_cputime cputime_expires;
    // 用来统计进程或进程组被跟踪的处理器时间,其中的三个成员对应着 cpu_timers[3]的三个链表

    struct list_head cpu_timers[3];

/* process credentials */
// 进程权能
    const struct cred *real_cred;   /* objective and real subjective task
                     * credentials (COW) */
    const struct cred *cred;    /* effective (overridable) subjective task
                     * credentials (COW) */
    struct mutex cred_guard_mutex;  /* guard against foreign influences on
                     * credential calculations
                     * (notably. ptrace) */
    struct cred *replacement_session_keyring; /* for KEYCTL_SESSION_TO_PARENT */

    char comm[TASK_COMM_LEN];
    // 可执行文件名称,不包含路径。

/* file system info */
    int link_count, total_link_count;
    // 硬链接数量

#ifdef CONFIG_SYSVIPC
/* ipc stuff */
    struct sysv_sem sysvsem;
    // 进程通信
#endif

#ifdef CONFIG_DETECT_HUNG_TASK
/* hung task detection */
    unsigned long last_switch_count;
#endif

/* CPU-specific state of this task */
    struct thread_struct thread;
    // cpu 状态 处理器特有数据


/* filesystem information */
    struct fs_struct *fs;
    // 进程与文件系统的联系,包括当前目录和根目录
/* open file information */
    struct files_struct *files;
    // 表示进程当前打开的文件
/* namespaces */
    struct nsproxy *nsproxy;
    // 命名空间
/* signal handlers */
    // 信号处理程序
    struct signal_struct *signal;
    struct sighand_struct *sighand;

    sigset_t blocked, real_blocked;
    sigset_t saved_sigmask; /* restored if set_restore_sigmask() was used */
    struct sigpending pending;

    unsigned long sas_ss_sp;
    size_t sas_ss_size;
    int (*notifier)(void *priv);
    void *notifier_data;
    sigset_t *notifier_mask;

    // 进程审计
    struct audit_context *audit_context;
#ifdef CONFIG_AUDITSYSCALL
    uid_t loginuid;
    unsigned int sessionid;
#endif

    seccomp_t seccomp;
    // 安全运算

/* Thread group tracking */
    // 用于 copy_process 函数 使用 CLONE_PANRENT 标记时
    u32 parent_exec_id;
    u32 self_exec_id;

/* Protection of (de-)allocation: mm, files, fs, tty, keyrings, mems_allowed,
 * mempolicy */
    spinlock_t alloc_lock;


#ifdef CONFIG_GENERIC_HARDIRQS
    /* IRQ handler threads */
    // 硬中断请求优先级别处理程序线程
    struct irqaction *irqaction;
#endif

    /* Protection of the PI data structures: */
    spinlock_t pi_lock;
    // task_rq_lock 函数所使用的 锁
#ifdef CONFIG_RT_MUTEXES
    //基于 PI 协议的等待互斥锁,其中 PI 是指优先级继承
    /* PI waiters blocked on a rt_mutex held by this task */
    struct plist_head pi_waiters;
    /* Deadlock detection and priority inheritance handling */
    struct rt_mutex_waiter *pi_blocked_on;
#endif

#ifdef CONFIG_DEBUG_MUTEXES
    /* mutex deadlock detection */
    // 死锁检测
    struct mutex_waiter *blocked_on;
#endif
#ifdef CONFIG_TRACE_IRQFLAGS
 中断
    unsigned int irq_events;
    int hardirqs_enabled;
    unsigned long hardirq_enable_ip;
    unsigned int hardirq_enable_event;
    unsigned long hardirq_disable_ip;
    unsigned int hardirq_disable_event;
    int softirqs_enabled;
    unsigned long softirq_disable_ip;
    unsigned int softirq_disable_event;
    unsigned long softirq_enable_ip;
    unsigned int softirq_enable_event;
    int hardirq_context;
    int softirq_context;
#endif

#ifdef CONFIG_LOCKDEP
// lockdep
# define MAX_LOCK_DEPTH 48UL
    u64 curr_chain_key;
    int lockdep_depth;
    unsigned int lockdep_recursion;
    struct held_lock held_locks[MAX_LOCK_DEPTH];
    gfp_t lockdep_reclaim_gfp;
#endif

/* journalling filesystem info */
    // jfs 文件系统
    void *journal_info;

/* stacked block device info */
    // 块设备链表
    struct bio *bio_list, **bio_tail;

/* VM state */
    struct reclaim_state *reclaim_state;
    // 内存回收
    struct backing_dev_info *backing_dev_info;
    // 存放块设备 I/O 数据流量信息
    struct io_context *io_context;
    // I/O 调度器所使用的信息
    unsigned long ptrace_message;
    siginfo_t *last_siginfo; /* For ptrace use.  */
    struct task_io_accounting ioac;
#if defined(CONFIG_TASK_XACCT)
    u64 acct_rss_mem1;  /* accumulated rss usage */
    u64 acct_vm_mem1;   /* accumulated virtual memory usage */
    cputime_t acct_timexpd; /* stime + utime since last update */
#endif
#ifdef CONFIG_CPUSETS
    // CPUSET 功能
    nodemask_t mems_allowed;    /* Protected by alloc_lock */
    int cpuset_mem_spread_rotor;
#endif
#ifdef CONFIG_CGROUPS
    //control groups
    /* Control Group info protected by css_set_lock */
    struct css_set *cgroups;
    /* cg_list protected by css_set_lock and tsk->alloc_lock */
    struct list_head cg_list;
#endif

#ifdef CONFIG_FUTEX
    // FUTEX 同步机制
    struct robust_list_head __user *robust_list;
#ifdef CONFIG_COMPAT
    struct compat_robust_list_head __user *compat_robust_list;
#endif
    struct list_head pi_state_list;
    struct futex_pi_state *pi_state_cache;
#endif

#ifdef CONFIG_PERF_EVENTS
    struct perf_event_context *perf_event_ctxp;
    struct mutex perf_event_mutex;
    struct list_head perf_event_list;
#endif

#ifdef CONFIG_NUMA
    // 非一致内存访问
    struct mempolicy *mempolicy;    /* Protected by alloc_lock */
    short il_next;
#endif

    // 文件系统互斥资源
    atomic_t fs_excl;   /* holding fs exclusive resources */
    // RCU 链表
    struct rcu_head rcu;

    /*
     * cache last used pipe for splice
     */
    struct pipe_inode_info *splice_pipe;
    // 管道

#ifdef  CONFIG_TASK_DELAY_ACCT
    // 延迟计数
    struct task_delay_info *delays;
#endif

#ifdef CONFIG_FAULT_INJECTION
    // fault injection 
    int make_it_fail;
#endif
    struct prop_local_single dirties;
#ifdef CONFIG_LATENCYTOP
    int latency_record_count;
    struct latency_record latency_record[LT_SAVECOUNT];
#endif
    /*
     * time slack values; these are used to round up poll() and
     * select() etc timeout values. These are in nanoseconds.
     */
    unsigned long timer_slack_ns;
    unsigned long default_timer_slack_ns;

    struct list_head    *scm_work_list;
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
    /* Index of current stored adress in ret_stack */
    int curr_ret_stack;
    /* Stack of return addresses for return function tracing */
    struct ftrace_ret_stack *ret_stack;
    /* time stamp for last schedule */
    unsigned long long ftrace_timestamp;
    /*
     * Number of functions that haven't been traced
     * because of depth overrun.
     */
    atomic_t trace_overrun;
    /* Pause for the tracing */
    atomic_t tracing_graph_pause;
#endif
#ifdef CONFIG_TRACING
    /* state flags for use by tracers */
    unsigned long trace;
    /* bitmask of trace recursion */
    unsigned long trace_recursion;
#endif /* CONFIG_TRACING */
    unsigned long stack_start;
};
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值