mmap
和munmap
系统调用允许UNIX程序对其地址空间进行详细控制。它们可用于在进程之间共享内存,将文件映射到进程地址空间,并作为用户级页面错误方案的一部分,如本课程中讨论的垃圾收集算法。在本实验室中,您将把mmap
和munmap
添加到xv6中,重点关注内存映射文件(memory-mapped files)。
一、mmap
1.实验要求
可以通过多种方式调用
mmap
,但本实验只需要与内存映射文件相关的功能子集。您可以假设addr
始终为零,这意味着内核应该决定映射文件的虚拟地址。mmap
返回该地址,如果失败则返回0xffffffffffffffff
。length
是要映射的字节数;它可能与文件的长度不同。prot
指示内存是否应映射为可读、可写,以及/或者可执行的;您可以认为prot
是PROT_READ
或PROT_WRITE
或两者兼有。flags
要么是MAP_SHARED
(映射内存的修改应写回文件),要么是MAP_PRIVATE
(映射内存的修改不应写回文件)。您不必在flags
中实现任何其他位。fd
是要映射的文件的打开文件描述符。可以假定offset
为零(它是要映射的文件的起点)。允许进程映射同一个
MAP_SHARED
文件而不共享物理页面。
munmap(addr, length)
应删除指定地址范围内的mmap
映射。如果进程修改了内存并将其映射为MAP_SHARED
,则应首先将修改写入文件。munmap
调用可能只覆盖mmap
区域的一部分,但您可以认为它取消映射的位置要么在区域起始位置,要么在区域结束位置,要么就是整个区域(但不会在区域中间“打洞”)。您应该实现足够的
mmap
和munmap
功能,以使mmaptest
测试程序正常工作。如果mmaptest
不会用到某个mmap
的特性,则不需要实现该特性。2.提示
- 首先,向
UPROGS
添加_mmaptest
,以及mmap
和munmap
系统调用,以便让user/mmaptest.c进行编译。现在,只需从mmap
和munmap
返回错误。我们在kernel/fcntl.h中为您定义了PROT_READ
等。运行mmaptest
,它将在第一次mmap
调用时失败。- 惰性地填写页表,以响应页错误。也就是说,
mmap
不应该分配物理内存或读取文件。相反,在usertrap
中(或由usertrap
调用)的页面错误处理代码中执行此操作,就像在lazy page allocation实验中一样。惰性分配的原因是确保大文件的mmap
是快速的,并且比物理内存大的文件的mmap
是可能的。- 跟踪
mmap
为每个进程映射的内容。定义与第15课中描述的VMA(虚拟内存区域)对应的结构体,记录mmap
创建的虚拟内存范围的地址、长度、权限、文件等。由于xv6内核中没有内存分配器,因此可以声明一个固定大小的VMA数组,并根据需要从该数组进行分配。大小为16应该就足够了。- 实现
mmap
:在进程的地址空间中找到一个未使用的区域来映射文件,并将VMA添加到进程的映射区域表中。VMA应该包含指向映射文件对应struct file
的指针;mmap
应该增加文件的引用计数,以便在文件关闭时结构体不会消失(提示:请参阅filedup
)。运行mmaptest
:第一次mmap
应该成功,但是第一次访问被mmap
的内存将导致页面错误并终止mmaptest
。- 添加代码以导致在
mmap
的区域中产生页面错误,从而分配一页物理内存,将4096字节的相关文件读入该页面,并将其映射到用户地址空间。使用readi
读取文件,它接受一个偏移量参数,在该偏移处读取文件(但必须lock/unlock传递给readi
的索引结点)。不要忘记在页面上正确设置权限。运行mmaptest
;它应该到达第一个munmap
。- 实现
munmap
:找到地址范围的VMA并取消映射指定页面(提示:使用uvmunmap
)。如果munmap
删除了先前mmap
的所有页面,它应该减少相应struct file
的引用计数。如果未映射的页面已被修改,并且文件已映射到MAP_SHARED
,请将页面写回该文件。查看filewrite
以获得灵感。- 理想情况下,您的实现将只写回程序实际修改的
MAP_SHARED
页面。RISC-V PTE中的脏位(D
)表示是否已写入页面。但是,mmaptest
不检查非脏页是否没有回写;因此,您可以不用看D
位就写回页面。- 修改
exit
将进程的已映射区域取消映射,就像调用了munmap
一样。运行mmaptest
;mmap_test
应该通过,但可能不会通过fork_test
。- 修改
fork
以确保子对象具有与父对象相同的映射区域。不要忘记增加VMA的struct file
的引用计数。在子进程的页面错误处理程序中,可以分配新的物理页面,而不是与父级共享页面。后者会更酷,但需要更多的实施工作。运行mmaptest
;它应该通过mmap_test
和fork_test
。运行
usertests
以确保一切正常。3.具体实现
(1)添加系统调用
在 user/user.h 中添加系统调用声明:
在 user/usys.pl 中添加 entry:
在 Makefile 中添加编译声明:
在 kernel/syscall.h 中添加系统调用码:
在 kernel/syscall.c 中添加系统调用函数引用:
(2)实现mmap
根据提示3,定义VMA结构体,并添加到进程结构体中
(3). 在allocproc中将vma数组初始化为全0
static struct proc* allocproc(void) { ... found: ... memset(&p->vma, 0, sizeof(p->vma)); return p; }
(4). 根据提示2、3、4,参考lazy实验中的分配方法(将当前
p->sz
作为分配的虚拟起始地址,但不实际分配物理页面),此函数写在sysfile.c中就可以使用静态函数argfd
同时解析文件描述符和struct file
uint64 sys_mmap(void) { uint64 addr; int length; int port; int flags; int vfd; struct file *vfile; int offset; uint64 err = 0xffffffffffffffff; //获取系统调用参数 if(argaddr(0,&addr)<0||argint(1,&length)<0||argint(2,&port)<0|| argint(3,&flags)<0||argfd(4,&vfd,&vfile)<0||argint(5,&offset)<0) return err; //实验提示中假定addr和offset为0,简化程序可能发生的情况 if(addr!=0||offset!=0||length<0) return err; //文件不可写则不允许拥有port_write权限时映射为MAP_SHARED if(vfile->writable==0&&(port&PORT_WRITE)!=0&&flags==MAP_SHARED) return err; struct proc *p = myproc(); //没有足够的虚拟地址空间 if(p->sz+length>MAXVA) return err; //遍历查找未使用的VMA结构体 for (int i = 0; i < NVMA;i++) { if(p->vma[i].used==0) { //找到未使用的VMA结构体 p->vma[i].used = 1; p->vma[i].addr = p->sz; p->vma[i].len = length; p->vma[i].port = port; p->vma[i].flags = flags; p->vma[i].vfile = vfile; p->vma[i].vfd = vfd; p->vma[i].offset = offset; //增加文件的引用计数 filedup(vfile); p->sz += length; return p->vma[i].addr; } } return err; }
(5). 根据提示5,此时访问对应的页面就会产生页面错误,需要在
usertrap
中进行处理,主要完成三项工作:分配物理页面,读取文件内容,添加映射关系void usertrap(void) { ... if(cause == 8) { ... } else if((which_dev = devintr()) != 0){ // ok } else if(cause == 13 || cause == 15) { #ifdef LAB_MMAP // 读取产生页面故障的虚拟地址,并判断是否位于有效区间 uint64 fault_va = r_stval(); if(PGROUNDUP(p->trapframe->sp) - 1 < fault_va && fault_va < p->sz) { if(mmap_handler(r_stval(), cause) != 0) p->killed = 1; } else p->killed = 1; #endif } else { ... } ... } /** * @brief mmap_handler 处理mmap惰性分配导致的页面错误 * @param va 页面故障虚拟地址 * @param cause 页面故障原因 * @return 0成功,-1失败 */ int mmap_handler(int va, int cause) { int i; struct proc* p = myproc(); // 根据地址查找属于哪一个VMA for(i = 0; i < NVMA; ++i) { if(p->vma[i].used && p->vma[i].addr <= va && va <= p->vma[i].addr + p->vma[i].len - 1) { break; } } if(i == NVMA) return -1; int pte_flags = PTE_U; if(p->vma[i].prot & PROT_READ) pte_flags |= PTE_R; if(p->vma[i].prot & PROT_WRITE) pte_flags |= PTE_W; if(p->vma[i].prot & PROT_EXEC) pte_flags |= PTE_X; struct file* vf = p->vma[i].vfile; // 读导致的页面错误 if(cause == 13 && vf->readable == 0) return -1; // 写导致的页面错误 if(cause == 15 && vf->writable == 0) return -1; void* pa = kalloc(); if(pa == 0) return -1; memset(pa, 0, PGSIZE); // 读取文件内容 ilock(vf->ip); // 计算当前页面读取文件的偏移量,实验中p->vma[i].offset总是0 // 要按顺序读读取,例如内存页面A,B和文件块a,b // 则A读取a,B读取b,而不能A读取b,B读取a int offset = p->vma[i].offset + PGROUNDDOWN(va - p->vma[i].addr); int readbytes = readi(vf->ip, 0, (uint64)pa, offset, PGSIZE); // 什么都没有读到 if(readbytes == 0) { iunlock(vf->ip); kfree(pa); return -1; } iunlock(vf->ip); // 添加页面映射 if(mappages(p->pagetable, PGROUNDDOWN(va), PGSIZE, (uint64)pa, pte_flags) != 0) { kfree(pa); return -1; } return 0; }
(6). 根据提示6实现
munmap
,且提示7中说明无需查看脏位就可写回uint64 sys_munmap(void) { uint64 addr; int length; if(argaddr(0, &addr) < 0 || argint(1, &length) < 0) return -1; int i; struct proc* p = myproc(); for(i = 0; i < NVMA; ++i) { if(p->vma[i].used && p->vma[i].len >= length) { // 根据提示,munmap的地址范围只能是 // 1. 起始位置 if(p->vma[i].addr == addr) { p->vma[i].addr += length; p->vma[i].len -= length; break; } // 2. 结束位置 if(addr + length == p->vma[i].addr + p->vma[i].len) { p->vma[i].len -= length; break; } } } if(i == NVMA) return -1; // 将MAP_SHARED页面写回文件系统 if(p->vma[i].flags == MAP_SHARED && (p->vma[i].prot & PROT_WRITE) != 0) { filewrite(p->vma[i].vfile, addr, length); } // 判断此页面是否存在映射 uvmunmap(p->pagetable, addr, length / PGSIZE, 1); // 当前VMA中全部映射都被取消 if(p->vma[i].len == 0) { fileclose(p->vma[i].vfile); p->vma[i].used = 0; } return 0; }
(7). 回忆lazy实验中,如果对惰性分配的页面调用了
uvmunmap
,或者子进程在fork中调用uvmcopy
复制了父进程惰性分配的页面都会导致panic,因此需要修改uvmunmap
和uvmcopy
检查PTE_V
后不再panic
if((*pte & PTE_V) == 0) continue;
(8). 根据提示8修改
exit
,将进程的已映射区域取消映射void exit(int status) { // Close all open files. for(int fd = 0; fd < NOFILE; fd++){ ... } // 将进程的已映射区域取消映射 for(int i = 0; i < NVMA; ++i) { if(p->vma[i].used) { if(p->vma[i].flags == MAP_SHARED && (p->vma[i].prot & PROT_WRITE) != 0) { filewrite(p->vma[i].vfile, p->vma[i].addr, p->vma[i].len); } fileclose(p->vma[i].vfile); uvmunmap(p->pagetable, p->vma[i].addr, p->vma[i].len / PGSIZE, 1); p->vma[i].used = 0; } } begin_op(); iput(p->cwd); end_op(); ... }
(9). 根据提示9,修改
fork
,复制父进程的VMA并增加文件引用计数int fork(void) { // increment reference counts on open file descriptors. for(i = 0; i < NOFILE; i++) ... ... // 复制父进程的VMA for(i = 0; i < NVMA; ++i) { if(p->vma[i].used) { memmove(&np->vma[i], &p->vma[i], sizeof(p->vma[i])); filedup(p->vma[i].vfile); } } safestrcpy(np->name, p->name, sizeof(p->name)); ... }
4.测试结果
写在最后,中间会出现异常报错的情况,不知道是我电脑的原因还是什么问题,解决办法就是哪里有报错就加对应的头文件。