从整理上理解进程创建、可执行文件的加载和进程执行进程切换，重点理解分析fork、execve和进程切换

最新推荐文章于 2022-04-03 11:35:25 发布

别傻了，我怎么会登微信(小剑)

最新推荐文章于 2022-04-03 11:35:25 发布

阅读量158

点赞数

本文链接：https://blog.csdn.net/weixin_43933648/article/details/88891589

版权

原创作品转载请注明出处 + https://github.com/mengning/linuxkernel/
学号 371
一、实验环境
实验楼
二、实验步骤
1.阅读理解task_struct数据结构
源码来源：http://codelab.shiyanlou.com/xref/linux-3.18.6/include/linux/sched.h#1235；如下图，截取该结构体的少量代码展示。
在这里插入图片描述
该结构体就是PCB,即进程控制块，进程的唯一标识。

2.fork函数
do_fork的源代码如下所示：

long do_fork(unsigned long clone_flags,
          unsigned long stack_start,
          unsigned long stack_size,
          int __user *parent_tidptr,
          int __user *child_tidptr)
{
    struct task_struct *p;
    int trace = 0;
    long nr;

    // ...

    // 复制进程描述符，返回创建的task_struct的指针
    p = copy_process(clone_flags, stack_start, stack_size,
             child_tidptr, NULL, trace);

    if (!IS_ERR(p)) {
        struct completion vfork;
        struct pid *pid;

        trace_sched_process_fork(current, p);

        // 取出task结构体内的pid
        pid = get_task_pid(p, PIDTYPE_PID);
        nr = pid_vnr(pid);

        if (clone_flags & CLONE_PARENT_SETTID)
            put_user(nr, parent_tidptr);

        // 如果使用的是vfork，那么必须采用某种完成机制，确保父进程后运行
        if (clone_flags & CLONE_VFORK) {
            p->vfork_done = &vfork;
            init_completion(&vfork);
            get_task_struct(p);
        }

        // 将子进程添加到调度器的队列，使得子进程有机会获得CPU
        wake_up_new_task(p);

        // ...

        // 如果设置了 CLONE_VFORK 则将父进程插入等待队列，并挂起父进程直到子进程释放自己的内存空间
        // 保证子进程优先于父进程运行
        if (clone_flags & CLONE_VFORK) {
            if (!wait_for_vfork_done(p, &vfork))
                ptrace_event_pid(PTRACE_EVENT_VFORK_DONE, pid);
        }

        put_pid(pid);
    } else {
        nr = PTR_ERR(p);
    }
    return nr;
}

在 Linux 内核中,供用户创建进程的系统调用fork()函数的响应函数是 sys_fork()、sys_clone()、sys_vfork()。这三个函数都是通过调用内核函数 do_fork() 来实现的。根据调用时所使用的 clone_flags 参数不同，do_fork() 函数完成的工作也各异。
do_fork() 函数生成一个新的进程，大致分为三个步骤。
A.建立进程控制结构并赋初值，使其成为进程映像。
B.必须为新进程的执行设置跟踪进程执行情况的相关内核数据结构。包括任务数组、自由时间列表 tarray_freelist 以及 pidhash[] 数组。这部分完成如下内容：
C.启动调度程序，使子进程获得运行的机会。
接来下，使用gdb跟踪分析一个fork系统调用内核处理函数do_fork 。命令如下：

cd LinuxKernel   
rm menu -rf
git clone https://github.com/mengning/menu.git
cd menu
mv test_fork.c test.c
make rootfs
gdb
file linux-3.18.6/vmlinux
target remote:1234
b sys_clone
b do_fork
b dup_task_struct
b copy_process
b copy_thread
b ret_from_for

在这里插入图片描述

进程：sys_clone->do_fork->copy_process->copy_thread->ret_form_fork的过程。

3.理解编译链接的过程和ELF可执行文件格式
编译需要经过预处理、编译、汇编、链接四个过程：预处理：主要处理宏定义、条件编译指令、头文件包含指令，预处理完成的基本上是对源程序的替代工作；编译：将代码转换为汇编代码；汇编：将汇编代码转为机器码，在Linux上一般为ELF目标文件；链接：将生成的目标文件与系统库文件进行链接，最终生成可执行文件。
ELF(Executable and Linking Format)是一种对象文件的格式，用于定义不同类型的对象文件(Object files)中都放了什么东西、以及都以什么样的格式去放这些东西。

4.编程使用exec*库函数加载一个可执行文件。
A.helloworld程序
#include<stdio.h>
int main(){
printf(“Hello World!\n”);
return 0;
B.利用如下命令运行
gcc -E -o hello.cpp hello.c -m32
gcc -x cpp-output -S -o hello.s hello.cpp -m32
gcc -x assembler -c hello.s -o hello.o -m32
gcc -o hello hello.o -m32 gcc -o hello.static hello.o -m32 -static
在这里插入图片描述

5.使用gdb跟踪分析一个execve系统调用内核处理函数do_execve ，验证您对Linux系统加载可执行程序所需处理过程的理解
使用如下命令设置断点

b sys_execve
b load_elf_binary
b start_kernel

在这里插入图片描述

内核中实际执行execv()或execve()系统调用的程序是do_execve()，这个函数先打开目标映像文件，并从目标文件的头部（第一个字节开始）读入若干（当前Linux内核中是128）字节（实际上就是填充ELF文件头，下面的分析可以看到），然后调用另一个函数search_binary_handler()，在此函数里面，它会搜索我们上面提到的Linux支持的可执行文件类型队列，让各种可执行程序的处理程序前来认领和处理。如果类型匹配，则调用load_binary函数指针所指向的处理函数来处理目标映像文件。在ELF文件格式中，处理函数是load_elf_binary函数，下面主要就是分析load_elf_binary函数的执行过程（说明：因为内核中实际的加载需要涉及到很多东西，这里只关注跟ELF文件的处理相关的代码）：

sys_execve() > do_execve() > do_execveat_common > search_binary_handler() > load_elf_binary()

6.特别关注新的可执行程序是从哪里开始执行的？为什么execve系统调用返回后新的可执行程序能顺利执行？对于静态链接的可执行程序和动态链接的可执行程序execve系统调用返回时会有什么不同？
新的可执行程序是从new_ip开始执行,start_thread实际上是把返回到用户态的位置从Int 0x80的下一条指令，变成了规定的新加载的可执行文件的入口位置,即修改内核堆栈的EIP的值作为新程序的起点。
当执行到execve系统调用时，陷入内核态，用execve加载的可执行文件覆盖当前进程的可执行程序，当execve系统调用返回时，返回新的可执行程序的执行起点（main函数位置），所以execve系统调用返回后新的可执行程序能顺利执行。
对于静态链接的可执行程序和动态链接的可执行程序execve系统调用返回时，如果是静态链接，elf_entry指向可执行文件规定的头部（main函数对应的位置0x8048***）；如果需要依赖动态链接库，elf_entry指向动态链接器的起点。动态链接主要是由动态链接器ld来完成的。

7.理解Linux系统中进程调度的时机，可以在内核代码中搜索schedule()函数，看都是哪里调用了schedule()，判断我们课程内容中的总结是否准确
用户态进程它在用户的时候，它没法直接调用schedule（），因为schedule是个内核函数，而且它也不是一个系统调用，没法直接调用它，只能间接的调用它，间接的调用schedule（）的时机就是中断处理过程
对于用户态进程，它要从当前运行中的进程切换出去的话，那么它就必须要进入中断，这个中断是一般中断，进入中断后才会有一个可能会发生进程调度的时机，所以一般的用户态进程只能被动调度
[内核线程]可以直接调用schedule()进行进程切换，也可以在中断处理过程中进行调度，也就是说内核线程作为一类的特殊的进程可以主动调度，也可以被动调度；用户态进程无法实现主动调度，仅能通过陷入内核态后的某个时机点进行调度，即在中断处理过程中进行调度。
进程调度的时机：
中断处理过程（包括时钟中断、I/O中断、系统调用和异常）中，直接调用schedule()，或者返回用户态时根据need_resched标记调用schedule()；
内核线程可以直接调用schedule()进行进程切换，也可以在中断处理过程中进行调度，也就是说内核线程作为一类的特殊的进程可以主动调度，也可以被动调度；
用户态进程无法实现主动调度，仅能通过陷入内核态后的某个时机点进行调度，即在中断处理过程中进行调度。
三、总结
通过实验，我了解到Linux系统的执行过程，理解了进程创建、可执行文件的加载和进程执行进程切换，同时对fork、execve和进程切换有了一定的了解。

别傻了，我怎么会登微信(小剑)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从整理上理解进程创建、可执行文件的加载和进程执行进程切换，重点理解分析fork、execve和进程切换

原创作品转载请注明出处 + https://github.com/mengning/linuxkernel/学号 371一、实验环境实验楼二、实验步骤1.阅读理解task_struct数据结构源码来源：http://codelab.shiyanlou.com/xref/linux-3.18.6/include/linux/sched.h#1235；如下图，截取该结构体的少量代码展示。...
复制链接

扫一扫