GNU嵌入式汇编和get_free_page代码解读
目录
教学视频
Linux内核:GNU嵌入式汇编和get_free_page代码解读
1. 楔子
get\_free\_page() 是内核代码中比较难以理解的一段代码,熟悉这段代码,对于我们熟悉和掌握内核中汇编代码有很大帮助,这里我们就对其代码实现进行仔细的阅读。2. 汇编基础知识
我们这里讲解几个本函数用到的汇编代码
- STOSL指令相当于将EAX中的值保存到 [ES]:EDI 指向的地址中,若设置了 EFLAGS 中的方向位置位(即在STOSL指令前使用STD指令)则EDI自减4,否则(使用CLD指令)EDI自增4
例如
cld;rep;stosl
cld设置edi或同esi为递增方向,rep做(%ecx)次重复操作,stosl表示edi每次增加4,然后将ax的内容保存到[ES]:EDI中 - repe和repne:前者是repeat equal,意思是相等的时候重复,后者是repeat not equal,不等的时候重复;每循环一次cx自动减一,重复cx次;
- scasb指令: 将[al] 中的内容和 es:[edi]中的内容进行比较,并且edi自动增加或减少,std则edi–;cld则edi++
- sall 指令: sall k,D 等价于 D = D << k 左移
3. GUN AS 参数语法
GNU 汇编代码中,对于输入/输出参数有些字符描述符,描述符的意义,作用分别如下
5. 代码解读
get_free_page 函数的目的是:寻找mem_map[0…(PAGING_PAGES-1)]中的空闲项,即mem_map[i]==0的项,如果找到,就返回其物理地址,找不到返回0,也就是NULL
代码实现如下
- register unsigned long __res asm(“ax”);
__res是寄存器级变量,值保存在ax寄存器中,就是说对__res的操作等于ax寄存器的操作 - __asm__(“std ; repne ; scasb\n\t”)
循环比较,找出mem_map[i]==0的页;
std设置DF=1,所以scasb执行递减操作,即每次edi–,指令涉及寄存器al, ecx, [es]:(e)di 三个寄存器,在函数尾部的定义中
:"=a" (__res)
:“0”(0),“i”(LOW_MEM),“c”(PAGING_PAGES),“D”(mem_map+PAGING_PAGES-1)
:“di”,“cx”,“dx”);
%0 是 ax寄存器
%1 al = 0, “0” 表示使用与上面同个位置的输出相同的寄存器,eax = 0, 即有 al = 0;
如果mem_map[i] == 0,表示为空闲页,否则为已分配占用,al保存0值,用于和[es]:edi比较
%2 LOW_MEM,低端内存标记,即1M
%3 ecx = PAGING_PAGES; 主内存叶表个数
%4 es:di = (mem_map+PAGING_PAGES-1); 内存管理数组最后一项
这句指令的意思是从数组mem_map[0…(PAGING_PAGES-1)]的最后一项 mem_map[PAGING_PAGES-1]开始,比较mem_map[i]是否等于0(0值保存在al寄存器中); 每比较一次,[es]:di值自动减1,如果不相等,[es]:di值减1,即mem_map[i–],继续比较,直到ecx==0; 如果相等,则跳出循环。跳出循环的时候,edi已经自动减1了,也就是说指向前面一个元素了。
-
“jne 1f\n\t” 如果mem_map[0…(PAGING_PAGES-1)]均不等于0, 跳转到标签1f处执行,Nf表示向前标签,Nb表示向后标签,N是取值1-10的十进制数字
-
“movb $1,1(%%edi)\n\t”
mem_map[i]==0是mem_map[0…(PAGING_PAGES-1)]中逆序第一个找到的等于0的目标,
将edi已经减1了,也就是已经指向了mem_map[i] = 0元素的前面一个元素了,这里加1就是重新指向mem_map[i] = 0 的起始地址上,即mem_map[i]=1,标志为该页已被占用,不是空闲位 -
“sall $12,%%ecx\n\t” 此时ecx保存的是mem_map[i]的下标i,即相对页面数(从LOW_MEM开始)
举例:
假设mem_map[0…(PAGING_PAGES-1)]最后一个参数
mem_map[PAGING_PAGES-1] == 0,即i == (PAGING_PAGES-1),
所以此时*ecx == PAGING_PAGES-1;
此时相对页面地址是4k*(PAGING_PAGES-1), 也就是(PAGING_PAGES-1) << 12 -
“addl %2,%%ecx\n\t” 加上低端内存地址,得到实际物理地址, %2等于LOW_MEM,在如下语句中定义"0" (0),“i” (LOW_MEM),“c” (PAGING_PAGES)
-
“movl %%ecx,%%edx\n\t”
将ecx寄存器的值保存到edx寄存器中,即将实际物理地址保存到edx寄存器中。 -
“movl $1024,%%ecx\n\t”
将1024保存到ecx寄存器中,因为每一页占用4096字节(4K), 每次写入4个字节,写入1024次 -
“leal 4092(%%edx),%%edi\n\t”,
取当前物理页最后一个字节的起始地址: 4096 = 4096-4 = 1023*4 = (1024-1)*4 。
将当前物理页最后一个字节的起始物理地址保存在edi寄存器中, 即ecx+4092处的地址保存在edi寄存器中。 -
“rep ; stosl\n\t” 从ecx+4092处开始,反方向,步进4字节,重复1024次,将该物理页1024项全部填入eax寄存器的值,在如下代码定义中,eax初始化为0(al=0,eax=0,ax=0)
:“0” (0),“i” (LOW_MEM),“c” (PAGING_PAGES),
所以该物理页项全部清零。 -
“movl %%edx,%%eax\n”,将该物理页面起始地址放入eax寄存器中,Intel的EABI规则中,eax寄存器用于保存函数返回值
-
“1:” 标签1,用于"jne 1f\n\t"语句跳转返回0值,
注意:eax寄存器只在"movl %%edx,%%eax\n"中被赋值,eax寄存器初始值是’0’,如果跳转到标签"1:"处,返回值是0,表示没有空闲物理页。 -
:"=a" (__res) 输出寄存器列表,这里只有一个,其中a表示eax寄存器
-
:“0” (0),“i” (LOW_MEM),“c” (PAGING_PAGES),
“0"表示与上面同个位置的输出相同的寄存器,即"0"等于输出寄存器eax,即eax既是输出寄存器,同时也是输入寄存器,当然,在时间颗粒度最小的情况小,eax不能同时作为输入或者输出寄存器,
只能作为输入或者输出寄存器;
“i” (LOW_MEM)是%2,从输出寄存器到输入寄存器依次编号%0,%1,%2…%N,
其中"i"表示立即数,不是edi的代号,edi的代号是"D”;
“c” (PAGING_PAGES)表示将ecx寄存器存入PAGING_PAGES,ecx寄存器代号"c"。 -
“D” (mem_map+PAGING_PAGES-1)
"D"使用edi寄存器,即edi寄存器保存的值是(mem_map+PAGING_PAGES-1)
即%%edi = &mem_map[PAGING_PAGES-1]。 -
:“di”,“cx”,“dx”);
保留寄存器,告诉编译器"di",“cx”,"dx"三个寄存器已经被分配,在编译器编译中,不会将这三个寄存器分配为输入或者输出寄存器。 -
return __res;
返回__res保存的值,相当于汇编的ret,隐含将eax寄存器返回,C语言中是显式返回。
附录: 常用汇编代码参考
汇编指令
GAS中每个操作都是有一个字符的后缀,表明操作数的大小。
C声明 | GAS后缀 | 大小(字节) |
char | b | 1 |
short | w | 2 |
(unsigned) int / long / char* | l | 4 |
float | s | 4 |
double | l | 8 |
long double | t | 10/12 |
注意:GAL使用后缀“l”同时表示4字节整数和8字节双精度浮点数,这不会产生歧义因为浮点数使用的是完全不同的指令和寄存器。
操作数格式:
格式 | 操作数值 | 名称 | 样例(GAS = C语言) |
$Imm | Imm | 立即数寻址 | $1 = 1 |
Ea | R[Ea] | 寄存器寻址 | %eax = eax |
Imm | M[Imm] | 绝对寻址 | 0x104 = *0x104 |
(Ea) | M[R[Ea]] | 间接寻址 | (%eax)= *eax |
Imm(Ea) | M[Imm+R[Ea]] | (基址+偏移量)寻址 | 4(%eax) = *(4+eax) |
(Ea,Eb) | M[R[Ea]+R[Eb]] | 变址 | (%eax,%ebx) = *(eax+ebx) |
Imm(Ea,Eb) | M[Imm+R[Ea]+R[Eb]] | 寻址 | 9(%eax,%ebx)= *(9+eax+ebx) |
(,Ea,s) | M[R[Ea]*s] | 伸缩化变址寻址 | (,%eax,4)= *(eax*4) |
Imm(,Ea,s) | M[Imm+R[Ea]*s] | 伸缩化变址寻址 | 0xfc(,%eax,4)= *(0xfc+eax*4) |
(Ea,Eb,s) | M(R[Ea]+R[Eb]*s) | 伸缩化变址寻址 | (%eax,%ebx,4) = *(eax+ebx*4) |
Imm(Ea,Eb,s) | M(Imm+R[Ea]+R[Eb]*s) | 伸缩化变址寻址 | 8(%eax,%ebx,4) = *(8+eax+ebx*4) |
注:M[xx]表示在存储器中xx地址的值,R[xx]表示寄存器xx的值,这种表示方法将寄存器、内存都看出一个大数组的形式。
** 数据传送指令:**
指令 | 效果 | 描述 |
movl S,D | D <-- S | 传双字 |
movw S,D | D <-- S | 传字 |
movb S,D | D <-- S | 传字节 |
movsbl S,D | D <-- 符号扩展S | 符号位填充(字节->双字) |
movzbl S,D | D <-- 零扩展S | 零填充(字节->双字) |
pushl S | R[%esp] <-- R[%esp] – 4; M[R[%esp]] <-- S | 压栈 |
popl D | D <-- M[R[%esp]]; R[%esp] <-- R[%esp] + 4; | 出栈 |
注:均假设栈往低地址扩展。
算数和逻辑操作地址:
指令 | 效果 | 描述 |
leal S,D | D = &S | movl地版,S地址入D,D仅能是寄存器 |
incl D | D++ | 加1 |
decl D | D-- | 减1 |
negl D | D = -D | 取负 |
notl D | D = ~D | 取反 |
addl S,D | D = D + S | 加 |
subl S,D | D = D – S | 减 |
imull S,D | D = D*S | 乘 |
xorl S,D | D = D ^ S | 异或 |
orl S,D | D = D | S | 或 |
andl S,D | D = D & S | 与 |
sall k,D | D = D << k | 左移 |
shll k,D | D = D << k | 左移(同sall) |
sarl k,D | D = D >> k | 算数右移 |
shrl k,D | D = D >> k | 逻辑右移 |
特殊算术操作:
指令 | 效果 | 描述 |
imull S | R[%edx]:R[%eax] = S * R[%eax] | 无符号64位乘 |
mull S | R[%edx]:R[%eax] = S * R[%eax] | 有符号64位乘 |
cltd S | R[%edx]:R[%eax] = 符号位扩展R[%eax] | 转换为4字节 |
idivl S | R[%edx] = R[%edx]:R[%eax] % S; R[%eax] = R[%edx]:R[%eax] / S; | 有符号除法,保存余数和商 |
divl S | R[%edx] = R[%edx]:R[%eax] % S; R[%eax] = R[%edx]:R[%eax] / S; | 无符号除法,保存余数和商 |
注:64位数通常存储为,高32位放在edx,低32位放在eax。
条件码:
条件码寄存器描述了最近的算数或逻辑操作的属性。
CF:进位标志,最高位产生了进位,可用于检查无符号数溢出。
OF:溢出标志,二进制补码溢出——正溢出或负溢出。
ZF:零标志,结果为0。
SF:符号标志,操作结果为负。
比较指令:
指令 | 基于 | 描述 |
cmpb S2,S1 | S1 – S2 | 比较字节,差关系 |
testb S2,S1 | S1 & S2 | 测试字节,与关系 |
cmpw S2,S1 | S1 – S2 | 比较字,差关系 |
testw S2,S1 | S1 & S2 | 测试字,与关系 |
cmpl S2,S1 | S1 – S2 | 比较双字,差关系 |
testl S2,S1 | S1 & S2 | 测试双字,与关系 |
访问条件码指令:
指令 | 同义名 | 效果 | 设置条件 |
sete D | setz | D = ZF | 相等/零 |
setne D | setnz | D = ~ZF | 不等/非零 |
sets D |
| D = SF | 负数 |
setns D |
| D = ~SF | 非负数 |
setg D | setnle | D = ~(SF ^OF) & ZF | 大于(有符号>) |
setge D | setnl | D = ~(SF ^OF) | 小于等于(有符号>=) |
setl D | setnge | D = SF ^ OF | 小于(有符号<) |
setle D | setng | D = (SF ^ OF) | ZF | 小于等于(有符号<=) |
seta D | setnbe | D = ~CF & ~ZF | 超过(无符号>) |
setae D | setnb | D = ~CF | 超过或等于(无符号>=) |
setb D | setnae | D = CF | 低于(无符号<) |
setbe D | setna | D = CF | ZF | 低于或等于(无符号<=) |
跳转指令:
指令 | 同义名 | 跳转条件 | 描述 |
jmp Label |
| 1 | 直接跳转 |
jmp *Operand |
| 1 | 间接跳转 |
je Label | jz | ZF | 等于/零 |
jne Label | jnz | ~ZF | 不等/非零 |
js Label |
| SF | 负数 |
jnz Label |
| ~SF | 非负数 |
jg Label | jnle | ~(SF^OF) & ~ZF | 大于(有符号>) |
jge Label | jnl | ~(SF ^ OF) | 大于等于(有符号>=) |
jl Label | jnge | SF ^ OF | 小于(有符号<) |
jle Label | jng | (SF ^ OF) | ZF | 小于等于(有符号<=) |
ja Label | jnbe | ~CF & ~ZF | 超过(无符号>) |
jae Label | jnb | ~CF | 超过或等于(无符号>=) |
jb Label | jnae | CF | 低于(无符号<) |
jbe Label | jna | CF | ZF | 低于或等于(无符号<=) |
转移控制指令(函数调用):
指令 | 描述 |
call Label | 过程调用,返回地址入栈,跳转到调用过程起始处,返回地址是call后面那条指令的地址 |
call *Operand | |
leave | 为返回准备好栈,为ret准备好栈,主要是弹出函数内的栈使用及%ebp |
LEAVE指令是将栈指针指向帧指针,然后POP备份的原帧指针到%EBP
Leave等价于:
/* leave指令将EBP寄存器的内容复制到ESP寄存器中,
* 以释放分配给该过程的所有堆栈空间。然后,它从堆栈恢复EBP寄存器的旧值。
* /
movl %esp %ebp
popl %ebp