Linux实验——从整理上理解进程创建、可执行文件的加载和进程执行进程切换，重点理解分析fork、execve和进程切换

最新推荐文章于 2022-11-03 10:47:16 发布

A22B9S

最新推荐文章于 2022-11-03 10:47:16 发布

阅读量291

点赞数 1

文章标签： Linux

本文链接：https://blog.csdn.net/A22B9S/article/details/88789153

版权

Linux实验——从整理上理解进程创建、可执行文件的加载和进程执行进程切换，重点理解分析fork、execve和进程切换

学号后三位为342
原创作品转载请注明出处 + https://github.com/mengning/linuxkernel/

实验工具

代码参考（实际为Linux-5.0.1）
VMware Workstation Pro
Ubuntu 18.04

实验目的

从整理上理解进程创建、可执行文件的加载和进程执行进程切换，重点理解分析fork、execve和进程切换

实验内容

task_struct数据结构

什么是进程？
<1> 进程是程序的一个执行实例
<2> 进程是正在执行的程序
<3> 进程是能分配处理器并由处理器执行的实体
为了管理进程，操作系统必须对每个进程所做的事情进行清楚的描述，为此，操作系统使用数据结构来代表处理不同的实体，这个数据结构就是通常所说的进程描述符或进程控制块（PCB）。
在linux操作系统下这就是task_struct结构，所属的头文件#include <sched.h>每个进程都会被分配一个task_struct结构，它包含了这个进程的所有信息，在任何时候操作系统都能够跟踪这个结构的信息.

分析fork函数对应的内核处理过程do_fork，代码如下

long do_fork(unsigned long clone_flags,
          unsigned long stack_start,
          unsigned long stack_size,
          int __user *parent_tidptr,
          int __user *child_tidptr)
{
    struct task_struct *p;
    int trace = 0;
    long nr;

    // ...

    // 复制进程描述符，返回创建的task_struct的指针
    p = copy_process(clone_flags, stack_start, stack_size,
             child_tidptr, NULL, trace);

    if (!IS_ERR(p)) {
        struct completion vfork;
        struct pid *pid;

        trace_sched_process_fork(current, p);

        // 取出task结构体内的pid
        pid = get_task_pid(p, PIDTYPE_PID);
        nr = pid_vnr(pid);

        if (clone_flags & CLONE_PARENT_SETTID)
            put_user(nr, parent_tidptr);

        // 如果使用的是vfork，那么必须采用某种完成机制，确保父进程后运行
        if (clone_flags & CLONE_VFORK) {
            p->vfork_done = &vfork;
            init_completion(&vfork);
            get_task_struct(p);
        }

        // 将子进程添加到调度器的队列，使得子进程有机会获得CPU
        wake_up_new_task(p);

        // ...

        // 如果设置了 CLONE_VFORK 则将父进程插入等待队列，并挂起父进程直到子进程释放自己的内存空间
        // 保证子进程优先于父进程运行
        if (clone_flags & CLONE_VFORK) {
            if (!wait_for_vfork_done(p, &vfork))
                ptrace_event_pid(PTRACE_EVENT_VFORK_DONE, pid);
        }

        put_pid(pid);
    } else {
        nr = PTR_ERR(p);
    }
    return nr;
}

Linux提供三个创建进程的系统调用，do_fork()、vfork()无参数的，clone()带参数的。
do_fork()处理了以下内容

- 调用copy_process，将当期进程复制一份出来为子进程，并且为子进程设置相应地上下文信息。
- 初始化vfork的完成处理信息（如果是vfork调用）
- 调用wake_up_new_task，将子进程放入调度器的队列中，此时的子进程就可以被调度进程选中，得以运行。
- 如果是vfork调用，需要阻塞父进程，知道子进程执行exec

copy_process()函数

- 检查各种标志位（已经省略）
- 调用dup_task_struct复制一份task_struct结构体，作为子进程的进程描述符。
- 检查进程的数量限制。
- 初始化定时器、信号和自旋锁。
- 初始化与调度有关的数据结构，调用了sched_fork，这里将子进程的state设置为TASK_RUNNING。
- 复制所有的进程信息，包括fs、信号处理函数、信号、内存空间（包括写时复制）等。
- 调用copy_thread，这又是关键的一步，这里设置了子进程的堆栈信息。
- 为子进程分配一个pid
- 设置子进程与其他进程的关系，以及pid、tgid等。这里主要是对线程做一些区分。

copy_thread()函数

- 获取子进程寄存器信息的存放位置
- 对子进程的thread.sp赋值，将来子进程运行，这就是子进程的esp寄存器的值。
- 如果是创建内核线程，那么它的运行位置是ret_from_kernel_thread，将这段代码的地址赋给thread.ip，之后准备其他寄存器信息，退出
- 将父进程的寄存器信息复制给子进程。
-  将子进程的eax寄存器值设置为0，所以fork调用在子进程中的返回值为0.
- 子进程从ret_from_fork开始执行，所以它的地址赋给thread.ip，也就是将来的eip寄存器。

使用gdb跟踪分析一个fork系统调用内核处理函数do_fork()

启动MenuOS

cd LinuxKernel
   
rm menu -rf

git clone https://github.com/mengning/menu.git

cd menu

mv test_fork.c test.c

make rootfs
//如果在PC进行这样操作，需要将menu文件夹下的Makefile文件修改

其中包括如下代码

int Fork(int argc, char *argv[])
{
	int pid;
	/* fork another process */
	pid = fork();
	if (pid<0) 
	{ 
		/* error occurred */
		fprintf(stderr,"Fork Failed!");
		exit(-1);
	} 
	else if (pid==0) 
	{
		/*	 child process 	*/
    printf("This is child Process!,my PID is %d\n",pid);
	} 
	else 
	{ 	
		/* 	parent process	 */
    printf("THis is parent process!,my process is %d\n",pid);
		/* parent will wait for the child to complete*/
		wait(NULL);
		printf("Child Complete!\n");
	}
}

在这里插入图片描述
进入gdb调试

gdb

gdb>file LinuxKernel/linux-5.0.1/vmlinux

gdb>target remote:1234

在以下位置设置断点

b sys_clone

 b _do_fork
 
 b dup_task_struct
 
 b copy_process

在这里插入图片描述

理解编译链接的过程和ELF可执行文件格式

在这里插入图片描述
ELF可执行文件的格式有以下三类

 - 可重定位的对象文件(Relocatable file)
 - 可执行的对象文件(Executable file)
 - 可被共享的对象文件(Shared object file)

静态链接与动态链接
- 静态链接：在编译链接时直接将需要的执行代码复制到最终可执行文件中，有点是代码的装在速度块，执行速度也比较快，对外部环境依赖度低。编译时它会把需要的所有代码都链接进去，应用程序相对较大
- 动态链接是在程序运行时由操作系统将需要的动态库加载到内存中。动态链接分为装载时动态链接和运行时动态链接。
编程使用exec*库函数加载一个可执行文件

在fork()函数中添加

execlp("/bin/ls",“ls”,NULL);

在这里插入图片描述

整体调用关系为

 sys_execve()->do_execve()->do_execveat_common()->__do_execve_file()->prepare_binprm()->search_binary_handler()->load_elf_binary()->start_thread()

进程调度的时机
- 中断处理过程（包括时钟中断、I/O中断、系统调用和异常）中，直接调用schedule()，或者返回用户态时根据need_resched标记调用schedule()
- 内核线程可以直接调用schedule()进行进程切换，也可以在中断处理过程中进行调度，也就是说内核线程作为一类的特殊的进程可以主动调度，也可以被动调度
- 用户态进程无法实现主动调度，仅能通过陷入内核态后的某个时机点进行调度，即在中断处理过程中进行调度。
使用gdb跟踪分析一个schedule()函数

首先设置断点，然后调试
在这里插入图片描述

schedul函数选择一个新的进程来运行，并调用context_switch进行上下文的切换。context_switch首先调用switch_mm切换CR3，然后调用宏switch_to来进行硬件上的上下文切换。

实验总结

Linux系统调用的层次如下：

用户程序-------->C库（即API）:INT 0x80------------>system_call------------>系统调用服务例程--------->内核程序
//API即就是系统提供的C库。系统调用是通过软中断指令INT 0x80实现的

通过系统调用，用户空间的应用程序就会进入内核空间，由内核代表该进程运行于内核空间，这就涉及到上下文的切换，用户空间和内核空间具有不同的地址映射，通用或专用的寄存器组，而用户空间的进程要传递很多变量、参数给内核，内核也要保存用户进程的一些寄存器、变量等，以便系统调用结束后回到用户空间继续执行，所谓的进程上下文，就是一个进程在执行的时候，CPU的所有寄存器中的值、进程的状态以及堆栈中的内容，当内核需要切换到另一个进程时，它需要保存当前进程的所有状态，即保存当前进程的进程上下文，以便再次执行该进程时，能够恢复切换时的状态，继续执行。
同理，硬件通过触发信号，导致内核调用中断处理程序，进入内核空间。这个过程中，硬件的一些变量和参数也要传递给内核，内核通过这些参数进行中断处理，中断上下文就可以理解为硬件传递过来的这些参数和内核需要保存的一些环境，主要是被中断的进程的环境。

Linux内核工作在进程上下文或者中断上下文。提供系统调用服务的内核代码代表发起系统调用的应用程序运行在进程上下文；另一方面，中断处理程序，异步运行在中断上下文。中断上下文和特定进程无关。

运行在进程上下文的内核代码是可以被抢占的（Linux2.6支持抢占）。但是一个中断上下文，通常都会始终占有CPU（当然中断可以嵌套，但我们一般不这样做），不可以被打断。正因为如此，运行在中断上下文的代码就要受一些限制（参考）

A22B9S

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Linux实验——从整理上理解进程创建、可执行文件的加载和进程执行进程切换，重点理解分析fork、execve和进程切换

Linux实验——从整理上理解进程创建、可执行文件的加载和进程执行进程切换，重点理解分析fork、execve和进程切换学号后三位为342原创作品转载请注明出处 + https://github.com/mengning/linuxkernel/实验工具代码链接VMware Workstation ProUbuntu 18.04实验目的从整理上理解进程创建、可执行文件的加载...
复制链接

扫一扫