mit6.s081 lab4实验记录

_气泡

已于 2023-06-14 21:02:17 修改

阅读量318

点赞数

分类专栏：操作系统文章标签：单片机嵌入式硬件

于 2023-06-13 16:34:41 首次发布

本文链接：https://blog.csdn.net/qq_30003797/article/details/131188652

版权

操作系统专栏收录该内容

8 篇文章 0 订阅

订阅专栏

lab4 ：trap

本章实验的内容是xv6系统的陷入机制，主要讲了用户态到内核态的陷入过程。主要分为三种情形：

系统调用
当用户进程请求系统资源或服务时，会使用系统调用进行操作。如进行IO输入输出、磁盘读写、请求/释放内存等等。
中断
一个设备触发了中断使得当前进程的运行需要响应内核设备驱动，如时钟中断，IO设备中断等。
异常
程序出现了类似缺页、运算除0等错误时会导致异常，此时将陷入内核态，由内核对发生异常的进程进行处理，比如杀死该进程。

当trap发生时，需要将用户进程的“现场”保存到内核中，内核使用pcb中的trapframe模块来保存所有与进程有关的寄存器。并在返回进程时，从trapframe恢复所有的寄存器。以系统调用为例，下面简单分析一下trap的全部流程：

用户进程请求系统调用
由于对系统调用函数已经设置了入口entry，所以会将系统调用的编号存入CPU的a7寄存器，同时将相关参数保存在a0-a8寄存中。接着使用ecall进入汇编“跳板”程序trampoline，为后续转入内核做准备
ecall指令主要做了以下三点工作：
（1）将代码从user mode切换到supervisor mode,使得可以执行特权指令以及修改一些高级寄存器如satp（页表地址寄存器）, stvec（保存trap指令的起始地址）, sepc（保存进程程序计数器的值）, ssratch（保存trapframe page的虚拟地址）。（2）ecall指令中将PC保存到SEPC，尽管其他的寄存器还是还是用户寄存器，但是这里的程序计数器明显已经不是用户代码的程序计数器。这里的程序计数器是从STVEC寄存器拷贝过来的值。
（3）内核提前设置好了STVEC寄存器的值为trampoline page，ecall会会跳转到STVEC寄存器指向的指令
进入trampoline之后，并没有完全进入内核，在trampoline页我们需要：
（1）首先，我们需要保存32个用户寄存器。因为很显然我们需要恢复用户应用程序的执行，尤其是当用户程序随机的被设备中断所打断时。我们希望内核能够响应中断，之后在用户程序完全无感知的情况下再恢复用户代码的执行。所以这意味着32个用户寄存器不能被内核弄乱。但是这些寄存器又要被内核代码所使用，所以在trap之前，你必须先在某处保存这32个用户寄存器。
（2）程序计数器也需要在某个地方保存，它几乎跟一个用户寄存器的地位是一样的，我们需要能够在用户程序运行中断的位置继续执行用户程序。
~~（3）我们需要将mode改成supervisor mode，因为我们想要使用内核中的各种各样的特权指令。~~
（4）SATP寄存器现在正指向user page table，而user page table只包含了用户程序所需要的内存映射和一两个其他的映射，它并没有包含整个内核数据的内存映射。所以在运行内核代码之前，我们需要将SATP指向kernel page table。
（5）我们需要将堆栈寄存器指向位于内核的一个地址，因为我们需要一个堆栈来调用内核的C函数。
（6）一旦我们设置好了，并且所有的硬件状态都适合在内核中使用，我们需要跳入内核的C代码。
几个问题：
用户态和内核态都能找trampoline page？
TA：因为在内核页表和用户页表都使用同一个虚拟地址TRAMPOLINE映射到了该页的真实物理地址，所以这个虚拟地址在用户态和内核态都是可以直接解析的。
为什么在uservec函数中可以找到trapframe的地址并将寄存器保存进去？
TA：在保存之前有一个交换寄存器值的操作

# swap a0 and sscratch
# so that a0 is TRAPFRAME
csrrw a0, sscratch, a0

sscratch寄存器在内核启动之后进入用户态之前，就trapframe固定的虚拟地址TRAPFRAME写入了该寄存器。上述汇编指令将sscratch寄存器的值与a0寄存器的值交换。因为此时的页表为用户页表，所以可以通过寄存器a0来对trapframe进行读写。trapframe虽然是PCB中的一个属性，但是在进程页表初始化中也将该物理块映射到用户页表了，因此可以通过用户页表访问。

pagetable_t
proc_pagetable(struct proc *p)
{
  //...............
  if (mappages(pagetable, TRAMPOLINE, PGSIZE,
               (uint64)trampoline, PTE_R | PTE_X) < 0)
  {
    uvmfree(pagetable, 0);
    return 0;
  }

  // map the trapframe just below TRAMPOLINE, for trampoline.S.
  if (mappages(pagetable, TRAPFRAME, PGSIZE,
               (uint64)(p->trapframe), PTE_R | PTE_W) < 0)
  {
    uvmunmap(pagetable, TRAMPOLINE, 1, 0);
    uvmfree(pagetable, 0);
    return 0;
  }

  return pagetable;
}

接下来读取内核栈地址到sp寄存器、读取kernel_trap地址作为后续跳转位置、读取内核页表地址并载入页表寄存器刷新快表。
最后，跳转进入kernel_trap，在用户态到内核态的kernel_trap是trap.c/usertrap函数。
进入usertrap函数后首先会将stvec寄存器指向kernelvec变量，这是内核空间trap处理代码的位置。因为此时已经进入内核，如果再发生trap如异常、中断等就需要内核的trap处理函数进行操作。
接着会判断trap发生原因如果是系统调用就会转入系统调用的代码、如果是其他的也会执行对应操作。
完成后转入usertrapret函数，首先关闭中断，在usertrap过程中打开了中断，这里关闭中断是因为我们将要更新stvec寄存器来指向用户空间trap处理代码，而之前在内核中，我们指向的是内核空间的trap处理代码。当我们将STVEC更新到指向用户空间的trap处理代码时，我们仍然在内核中执行代码。如果这时发生了一个中断，那么程序执行会走向用户空间的trap处理代码，即便我们现在仍然在内核中，出于各种各样具体细节的原因，这会导致内核出错。所以我们这里关闭中断。
设置了STVEC寄存器指向trampoline代码的userret函数，在那里最终会执行sret指令返回到用户空间。位于trampoline代码最后的sret指令会重新打开中断。这样，即使我们刚刚关闭了中断，当我们在执行用户代码时中断是打开的。
接下来的几行填入了trapframe的内容，这些内容对于执行trampoline代码非常有用。
存储了kernel page table的指针
存储了当前用户进程的kernel stack
存储了usertrap函数的指针，这样trampoline代码才能跳转到这个函数
从tp寄存器中读取当前的CPU核编号，并存储在trapframe中，这样trampoline代码才能恢复这个数字，因为用户代码可能会修改这个数字
现在我们在usertrapret函数中，我们正在设置trapframe中的数据，这样下一次从用户空间转换到内核空间时可以用到这些数据。
接下来我们要设置SSTATUS寄存器，这是一个控制寄存器。这个寄存器的SPP bit位控制了sret指令的行为，该bit为0表示下次执行sret的时候，我们想要返回user mode而不是supervisor mode。这个寄存器的SPIE bit位控制了，在执行完sret之后，是否打开中断。因为我们在返回到用户空间之后，我们的确希望打开中断，所以这里将SPIE bit位设置为1。修改完这些bit位之后，我们会把新的值写回到SSTATUS寄存器。
最后
在trampoline代码的最后执行了sret指令。这条指令会将程序计数器设置成SEPC寄存器的值，所以现在我们将SEPC寄存器的值设置成之前保存的用户程序计数器的值。在不久之前，我们在usertrap函数中将用户程序计数器保存在trapframe中的epc字段。
接下来，我们根据user page table地址生成相应的SATP值，这样我们在返回到用户空间的时候才能完成page table的切换。实际上，我们会在汇编代码trampoline中完成page table的切换，并且也只能在trampoline中完成切换，因为只有trampoline中代码是同时在用户和内核空间中映射。但是我们现在还没有在trampoline代码中，我们现在还在一个普通的C函数中，所以这里我们将page table指针准备好，并将这个指针作为第二个参数传递给汇编代码，这个参数会出现在a1寄存器。
倒数第二行的作用是计算出我们将要跳转到汇编代码的地址。我们期望跳转的地址是tampoline中的userret函数，这个函数包含了所有能将我们带回到用户空间的指令。所以这里我们计算出了userret函数的地址。
倒数第一行，将fn指针作为一个函数指针，执行相应的函数（也就是userret函数）并传入两个参数，两个参数存储在a0，a1寄存器中。

进入userret函数中首先将用户页表写入satp并刷新快表，接着从trapframe中读取保存的寄存器，交换a0的sscratch的值，最后使用sret切换会用户空间。sret会根据设置切换到用户空间，并将spec寄存器的值写入pc,重新打开中断

至此就完成了一次trap的全部处理流程

2. Backtrace

这个函数就是实现曾经调用函数地址的回溯，这个功能在日常的编程中也经常见到，编译器报错时就是类似的逻辑，只不过题目的要求较为简单，只用打印程序地址，而实际的报错中往往打印程序文件名，函数名以及行号等信息（最后的可选练习就是实现这样的功能）。

// 打印返回地址
void backtrace()
{
  printf("%s\n", "backtrace");

  uint64 fp = r_fp(); // 获取寄存器fp的值
  uint64 loop_end = PGROUNDUP(fp);
  uint64 pre_fp;
  uint64 r_a;
  while (fp != loop_end)
  {
    // fp是当前栈帧的地址 将其向下偏移8字节得到栈帧中保存返回地址的地址
    // 为了获取改地址内保存的值，需要采用解指针的方式获取。但fp-8虽然是一个地址值
    // 但他并不是一个指针 所以需要现将其转化为一个指针类型 再去解指针即可
    // 这些虚拟地址是如何对应的最终物理地址 是由硬件通过内核页表获取映射实现的
    r_a = *((uint64 *)(fp - 8)); // 获取返回地址
    printf("%p\n", r_a);
    pre_fp = *((uint64 *)(fp - 16)); // 获取上一个栈帧的地址
    fp = pre_fp;
  }
}

根据提示：返回地址位于栈帧帧指针的固定偏移(-8)位置，并且保存的帧指针位于帧指针的固定偏移(-16)位置。先使用r_fp()读取当前的帧指针，然后读出返回地址并打印，再将fp定位到前一个帧指针的位置继续读取即可。
V6在内核中以页面对齐的地址为每个栈分配一个页面，所以通过判断fp是否到达页面的最顶部来判断是否回溯结束。

3.Alarm

这个练习主要是想实现一个定期的警报，当进程占用的CPU时钟达到tick后，就会执行对应的函数，函数执行结束后会返回到进程原来的位置继续执行。
程序计数器的过程是这样的：

ecall指令中将PC保存到SEPC
在usertrap中将SEPC保存到p->trapframe->epc
p->trapframe->epc加4指向下一条指令
执行系统调用
在usertrapret中将SEPC改写为p->trapframe->epc中的值
在sret中将PC设置为SEPC的值
因此只需要将p->trapframe->epc修改为要跳转的指令地址即可，handler可能会改变用户寄存器，为了后续能够恢复到原来的位置，需要将所有的寄存器值保存在另一个field内，并在sigreturn系统调用中将trapframe恢复原来的值。
另外为了让报警函数不会重复执行，要确保当前函数执行完成后在执行下一次报警，所以需要新增一个字段waitRet确保只有一个报警函数在执行。因此我们要在usertrap中再次保存用户寄存器，当handler调用sigreturn时将其恢复，并且要防止在handler执行过程中重复调用。
注意：新增的trapframe_Tmp字段要在allocproc函数中分配物理内存，并在进程销毁时释放对应的内存。结构的复制直接用赋值运算符即可。