mprotect系统调用是修改内存页属性的,他修改的内容包括vma的内容和页表项内容。linux用vma链表管理一个进程使用的虚拟地址空间。下面是实现代码。
/*
* linux/mm/mprotect.c
*
* (C) Copyright 1994 Linus Torvalds
*/
#include <linux/stat.h>
#include <linux/sched.h>
#include <linux/kernel.h>
#include <linux/mm.h>
#include <linux/shm.h>
#include <linux/errno.h>
#include <linux/mman.h>
#include <linux/string.h>
#include <linux/malloc.h>
#include <asm/segment.h>
#include <asm/system.h>
#include <asm/pgtable.h>
// 修改虚拟地址address到address+size的页表项内容
static inline void change_pte_range(pmd_t * pmd, unsigned long address,
unsigned long size, pgprot_t newprot)
{
pte_t * pte;
unsigned long end;
if (pmd_none(*pmd))
return;
if (pmd_bad(*pmd)) {
printk("change_pte_range: bad pmd (%08lx)\n", pmd_val(*pmd));
pmd_clear(pmd);
return;
}
// 获取一项页表项地址
pte = pte_offset(pmd, address);
// 屏蔽低位
address &= ~PMD_MASK;
// 结束地址
end = address + size;
// 不能超过该目录项管理的地址范围
if (end > PMD_SIZE)
end = PMD_SIZE;
do {
pte_t entry = *pte;
if (pte_present(entry))
// 更新页表项内容
*pte = pte_modify(entry, newprot);
// 下一个待处理的虚拟地址
address += PAGE_SIZE;
pte++;
} while (address < end);
}
// 修改虚拟地址address到address+size区间的页目录项、页表项内容
static inline void change_pmd_range(pgd_t * pgd, unsigned long address,
unsigned long size, pgprot_t newprot)
{
pmd_t * pmd;
unsigned long end;
if (pgd_none(*pgd))
return;
if (pgd_bad(*pgd)) {
printk("change_pmd_range: bad pgd (%08lx)\n", pgd_val(*pgd));
pgd_clear(pgd);
return;
}
// 某个页目录项
pmd = pmd_offset(pgd, address);
address &= ~PGDIR_MASK;
end = address + size;
if (end > PGDIR_SIZE)
end = PGDIR_SIZE;
do {
change_pte_range(pmd, address, end - address, newprot);
address = (address + PMD_SIZE) & PMD_MASK;
pmd++;
} while (address < end);
}
// 修改当前进程虚拟地址start到start+end区间的页目录和页表项内容
static void change_protection(unsigned long start, unsigned long end, pgprot_t newprot)
{
pgd_t *dir;
// 返回某页目录项地址
dir = pgd_offset(current, start);
while (start < end) {
// 修改某页目录项对应的页表内容
change_pmd_range(dir, start, end - start, newprot);
start = (start + PGDIR_SIZE) & PGDIR_MASK;
dir++;
}
// 刷新快表
invalidate();
return;
}
// 设置vma的读写属性和映射方式
static inline int mprotect_fixup_all(struct vm_area_struct * vma,
int newflags, pgprot_t prot)
{
// 用户层面的属性
vma->vm_flags = newflags;
// 页的属性,和vm_flags存在映射关系
vma->vm_page_prot = prot;
return 0;
}
// 修改开始地址为vma->start,结束地址为end的内存属性
static inline int mprotect_fixup_start(struct vm_area_struct * vma,
unsigned long end,
int newflags, pgprot_t prot)
{
struct vm_area_struct * n;
// vma的flag和prot是是针对整个vma的,所以这里要切分成两个vma
n = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
if (!n)
return -ENOMEM;
// 复制原vma结构体内容
*n = *vma;
// 修改原vma的start为end,即一分为二
vma->vm_start = end;
// 新vma的start不变,end改成切分边界的值
n->vm_end = end;
// 重新计算偏移,可能超过end
vma->vm_offset += vma->vm_start - n->vm_start;
// 只需要设置新块的标记
n->vm_flags = newflags;
n->vm_page_prot = prot;
// 多了一个vma引用文件
if (n->vm_inode)
n->vm_inode->i_count++;
if (n->vm_ops && n->vm_ops->open)
n->vm_ops->open(n);
// 插入进程的vma结构
insert_vm_struct(current, n);
return 0;
}
// 设置开始地址为start结束地址为vma的end这片内存的属性
static inline int mprotect_fixup_end(struct vm_area_struct * vma,
unsigned long start,
int newflags, pgprot_t prot)
{
struct vm_area_struct * n;
// 一分为二,申请一块新的vma
n = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
if (!n)
return -ENOMEM;
*n = *vma;
// start为切分边界,修改原vma的end为start
vma->vm_end = start;
// 新vma的start为start
n->vm_start = start;
// 相当于vm_offset = vm_offset - vma->start + n->vm_start,新地址加上相对偏移
n->vm_offset += n->vm_start - vma->vm_start;
// 只需设置新块的属性
n->vm_flags = newflags;
n->vm_page_prot = prot;
// 多了一个vma引用文件
if (n->vm_inode)
n->vm_inode->i_count++;
if (n->vm_ops && n->vm_ops->open)
n->vm_ops->open(n);
// 插入进程vma结构
insert_vm_struct(current, n);
return 0;
}
// 设置开始地址为start结束地址为end这片内存的属性
static inline int mprotect_fixup_middle(struct vm_area_struct * vma,
unsigned long start, unsigned long end,
int newflags, pgprot_t prot)
{
struct vm_area_struct * left, * right;
// 一分为三
left = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
if (!left)
return -ENOMEM;
right = (struct vm_area_struct *) kmalloc(sizeof(struct vm_area_struct), GFP_KERNEL);
if (!right) {
kfree(left);
return -ENOMEM;
}
// 复制得到默认值
*left = *vma;
*right = *vma;
// 一块的结束地址是start
left->vm_end = start;
// 第二块的开始地址是start,结束地址是end,start和end是用户修改属性的内存范围
vma->vm_start = start;
vma->vm_end = end;
// 第三块的start是end
right->vm_start = end;
// 第一块不需要更新offset,第二、第三块需要更新offset,都是新开始地址+之前的相对偏移
vma->vm_offset += vma->vm_start - left->vm_start;
right->vm_offset += right->vm_start - left->vm_start;
// 只需要设置第二块的属性
vma->vm_flags = newflags;
vma->vm_page_prot = prot;
// 多了两个vma引用文件
if (vma->vm_inode)
vma->vm_inode->i_count += 2;
if (vma->vm_ops && vma->vm_ops->open) {
vma->vm_ops->open(left);
vma->vm_ops->open(right);
}
// 插入两个vma
insert_vm_struct(current, left);
insert_vm_struct(current, right);
return 0;
}
// 修改一个vma某个内存区间的属性
static int mprotect_fixup(struct vm_area_struct * vma,
unsigned long start, unsigned long end, unsigned int newflags)
{
pgprot_t newprot;
int error;
// 不变
if (newflags == vma->vm_flags)
return 0;
// 见mmap.c的protection_map,把用户层的标记转成页表项格式的值,第四位表示是否共享
newprot = protection_map[newflags & 0xf];
if (start == vma->vm_start)
if (end == vma->vm_end)
// 地址完全重合则直接覆盖vma的设置
error = mprotect_fixup_all(vma, newflags, newprot);
else
// start重合则修改start到end的设置
error = mprotect_fixup_start(vma, end, newflags, newprot);
// 结束地址重合
else if (end == vma->vm_end)
error = mprotect_fixup_end(vma, start, newflags, newprot);
else
// 中间部分重合
error = mprotect_fixup_middle(vma, start, end, newflags, newprot);
if (error)
return error;
// 修改页目录、页表的内容
change_protection(start, end, newprot);
return 0;
}
// 设置start开始,大小是len的这片内存的属性为prot
asmlinkage int sys_mprotect(unsigned long start, size_t len, unsigned long prot)
{
unsigned long nstart, end, tmp;
struct vm_area_struct * vma, * next;
int error;
// 低12位不为0,没有页对齐,报错
if (start & ~PAGE_MASK)
return -EINVAL;
// 长度是页大小的整数倍,~PAGE_MASK表示不够一页则补足一页
len = (len + ~PAGE_MASK) & PAGE_MASK;
// 修改的末地址
end = start + len;
if (end < start)
return -EINVAL;
// 只能设置这三个标记
if (prot & ~(PROT_READ | PROT_WRITE | PROT_EXEC))
return -EINVAL;
// 没有内存需要修改
if (end == start)
return 0;
// 找出地址start对应vma
vma = find_vma(current, start);
// 地址无效
if (!vma || vma->vm_start > start)
return -EFAULT;
// 循环处理
for (nstart = start ; ; ) {
unsigned int newflags;
/* Here we know that vma->vm_start <= nstart < vma->vm_end. */
/*
(vma->vm_flags & ~(PROT_READ | PROT_WRITE | PROT_EXEC))表示清掉读写执行三个标记,
保留其他的标记,然后再与prot。即重新设置读写执行位
*/
newflags = prot | (vma->vm_flags & ~(PROT_READ | PROT_WRITE | PROT_EXEC));
/*
flag的取值见mm.h
高四位是标记对应的属性是否可以设置。从低到高分别是可读、可写、可执行
newflags右移四位把高四位移到第四位,四位中,置一的位说明可以设置,所以不需要校验,
只需要校验为0的位,所以取反,置0的位变成1,如果最后与的时候非0,说明用户设置了这一位,
则不合法。(最后&0xf说明只关注低四位。)
*/
if ((newflags & ~(newflags >> 4)) & 0xf) {
error = -EACCES;
break;
}
// 成立的话说明用户设置的内存区间落在一个vma里,直接修改就行,否则需要修改多个vma,见下面
if (vma->vm_end >= end) {
error = mprotect_fixup(vma, nstart, end, newflags);
break;
}
// 用户设置的end大于vma的end,所以需要设置多次
tmp = vma->vm_end;
// 下一个vma
next = vma->vm_next;
// 设置第一个vma的属性,下一轮修改下一个vma的属性
error = mprotect_fixup(vma, nstart, tmp, newflags);
if (error)
break;
// 重新设置start的值,为当前vma的end,而不是下一个vma的开始地址
nstart = tmp;
vma = next;
// 下一块的start不等于nstart,即不等于上一块的end,说明不连续,用户设置的范围不合法,报错
if (!vma || vma->vm_start != nstart) {
error = -EFAULT;
break;
}
}
// 处理avl树
merge_segments(current, start, end);
return error;
}