《30天自制操作系统》笔记(07)——内存管理
进度回顾
上一篇中处理掉了绝大部分与CPU配置相关的东西。本篇介绍内存管理的思路和算法。
现在想想,从软件工程师的角度看,CPU也只是一个软件而已:它的功能就是加载指令、执行指令和响应中断,而响应中断也是在加载指令、执行指令。就像火车沿着一条环形铁轨前进;当中断发生时,就好像铁轨岔口处变轨了,火车就顺着另一条轨迹走了;走完之后又绕回来重新开始。决定CPU是否变轨的,就是CPU里的特定寄存器。
这是题外话,就此为止。
什么是内存管理
假设内存大小是128MB,应用程序A暂时需要100KB,画面控制需要1.2MB……。
像这样,操作系统有时要分配一定大小的内存,用完后又要收回。因此,必须管理好哪些内存空闲可用,哪些正在被占用。这就是内存管理。
内存管理的两个任务,一是内存分配,一是内存释放。
如何获取内存容量
检查内存容量的方法
要管理内存,首先得知道操作系统所在的这个计算机内存有多大。检查内存容量的方法很简单,就是从要检查的起始位置到最后位置依次写入一个数值(例如0xaa55aa55),然后按位反转,检查是否正确地完成了反转(变成0x55aa55aa);然后再次反转,检查是否正确地完成了反转。如果反转结果都是正确的,说明这个地址的内存是存在的;否则就说明内存的最大地址就到此为止了。其代码如下。
1 unsigned int memtest_sub(unsigned int start, unsigned int end) 2 { 3 unsigned int i, *p, old, pat0 = 0xaa55aa55, pat1 = 0x55aa55aa; 4 for (i = start; i <= end; i += 0x1000) { 5 p = (unsigned int *) (i + 0xffc); 6 old = *p; /* 先记住修改前的值 */ 7 *p = pat0; /* 试写 */ 8 *p ^= 0xffffffff; /* 反转 */ 9 if (*p != pat1) { /* 检查反转结果 */ 10 not_memory: 11 *p = old; 12 break; 13 } 14 *p ^= 0xffffffff; /* 再次反转 */ 15 if (*p != pat0) { /* 检查是否恢复 */ 16 goto not_memory; 17 } 18 *p = old; /* 恢复为修改前的值 */ 19 } 20 return i; 21 }
但直接用C语言来写这个函数的话,C编译器会把它优化成这个样子。
1 unsigned int memtest_sub(unsigned int start, unsigned int end) 2 { 3 unsigned int i, *p, old, pat0 = 0xaa55aa55, pat1 = 0x55aa55aa; 4 for (i = start; i <= end; i += 0x1000) { 5 //全部被优化掉 了 6 } 7 return i; 8 }
C编译器不会理睬"内存到头了"这种事情,它只在应用程序的层面看问题。所以它认为for循环里的if判定都是必然为真(或为假)的,认为没有被其它代码使用的变量都是没用的。所以它就干脆把这些"没用的"代码删掉了。
为了解决这个问题,还是用汇编语言来写这个memtest_sub函数好了。代码如下。
1 _memtest_sub: ; unsigned int memtest_sub(unsigned int start, unsigned int end) 2 PUSH EDI ; (由于还要使用EBX, ESI, EDI) 3 PUSH ESI 4 PUSH EBX 5 MOV ESI,0xaa55aa55 ; pat0 = 0xaa55aa55; 6 MOV EDI,0x55aa55aa ; pat1 = 0x55aa55aa; 7 MOV EAX,[ESP+12+4] ; i = start; 8 mts_loop: 9 MOV EBX,EAX 10 ADD EBX,0xffc ; p = i + 0xffc; 11 MOV EDX,[EBX] ; old = *p; 12 MOV [EBX],ESI ; *p = pat0; 13 XOR DWORD [EBX],0xffffffff ; *p ^= 0xffffffff; 14 CMP EDI,[EBX] ; if (*p != pat1) goto fin; 15 JNE mts_fin 16 XOR DWORD [EBX],0xffffffff ; *p ^= 0xffffffff; 17 CMP ESI,[EBX] ; if (*p != pat0) goto fin; 18 JNE mts_fin 19 MOV [EBX],EDX ; *p = old; 20 ADD EAX,0x1000 ; i += 0x1000; 21 CMP EAX,[ESP+12+8] ; if (i <= end) goto mts_loop; 22 JBE mts_loop 23 POP EBX 24 POP ESI 25 POP EDI 26 RET 27 mts_fin: 28 MOV [EBX],EDX ; *p = old; 29 POP EBX 30 POP ESI 31 POP EDI 32 RET
知道了内存容量,就可以进行管理了。
关闭CPU高速缓存
486以上的CPU是有高速缓存(cache)的。CPU每次访问内存,都要将所访问的地址和内容存入cache,也就是存放成这样"18号地址的值是54"。如果下次要用18号地址的内容,CPU就不需要再读内存了(速度慢),而是直接从cache中取得18号地址的内容(速度快)。
如果开启着CPU高速缓存(cache),上述的检测代码就不会正常工作。因为写入一个内存地址,然后立即读出,这样的操作符合cache到的情况,CPU不会从内存读,而是直接读cache到的东西。结果,所有的内存都"正常",检测代码就起不到作用了。
1 #define EFLAGS_AC_BIT 0x00040000 2 #define CR0_CACHE_DISABLE 0x60000000 3 4 unsigned int memtest(unsigned int start, unsigned int end) 5 { 6 char flg486 = 0; 7 unsigned int eflg, cr0, i; 8 9 /* 确认CPU是386还是486以上的 */ 10 eflg = io_load_eflags(); 11 eflg |= EFLAGS_AC_BIT; /* AC-bit = 1 */ 12 io_store_eflags(eflg); 13 eflg = io_load_eflags(); 14 if ((eflg & EFLAGS_AC_BIT) != 0) { /* 如果是386,即使设定AC=1,AC的值还会自动回到0 */ 15 flg486 = 1; 16 } 17 eflg &= ~EFLAGS_AC_BIT; /* AC-bit = 0 */ 18 io_store_eflags(eflg); 19 20 if (flg486 != 0) { 21 cr0 = load_cr0(); 22 cr0 |= CR0_CACHE_DISABLE; /* 禁止缓存 */ 23 store_cr0(cr0); 24 } 25 26 i = memtest_sub(start, end); 27 28 if (flg486 != 0) { 29 cr0 = load_cr0(); 30 cr0 &= ~CR0_CACHE_DISABLE; /* 允许缓存 */ 31 store_cr0(cr0); 32 } 33 34 return i; 35 }
内存管理算法
假设内存有128MB(0x08000000字节),以4KB(0x1000字节)为单位进行管理。
最简单的方法
128MB/4KB=32768。所以我们创建32768字节的区域,写入0表示对应的内存是空闲的,写入1表示对应的内存是正在使用的。这个方法的名字我没有查到。
1 char a[32768]; 2 for (i = 0; i < 1024; i++) { 3 a[i] = 1; //一直到4MB为止,标记为正在使用(BIOS、OS等) 4 } 5 for (i = 1024; i< 32768; i++) { 6 a[i] = 0; //剩下的全部标记为空闲 7 }
比如需要100KB的内存,那么只要从a中找出连续25个标记为0的地方就可以了。
1 //从a[j]到a[j + 24]为止,标记连续为0"; 2 j = 0; 3 再来一次: 4 for (i = 0; i < 25; i++) { 5 if (a[j + i] != 0) { 6 j++; 7 if (j < 32768 - 25) goto 再来一次; 8 "没有可用内存了"; 9 } 10 } 11 //从j * 0x1000开始的100KB空间得到分配 12 for (i = 0; i < 25; i++) { 13 a[j + i] = 1; 14 }
需要收回这100KB的时候,用地址值/0x1000,计算出j就可以了。
1 j = 0x00123000 / 0x1000; 2 for (i = 0; i < 25; i++) { 3 a[j + i] = 0; 4 }
当然,我们可以用1bit来代替1个char,这样所需的管理空间就可以省下7/8,使用方法则是一样的。
列表管理
把类似于"从xxx号地址开始的yyy字节的空间是空闲的"这种信息都存储到列表里。
1 struct FREEINFO { /* 可用状况 */ 2 unsigned int addr, size; 3 }; 4 5 struct MEMMAN { /* 内存管理 */ 6 int frees, maxfrees, lostsize, losts; 7 struct FREEINFO free[MEMMAN_FREES]; 8 }; 9 struct MEMMAN memman; 10 memman.frees = 1;//可用状况list中只有1件 11 memman.free[0].addr = 0x00400000;//从0x00400000号地址开始 12 memman.free[0].size = 0x07c00000;//有124MB可用
比如,如果需要100KB的内存,只要查看memman中free的状况,从中找到100MB以上的可用空间就行了。
1 for (i = 0; i < memman.frees; i++) { 2 if (memman.free[i].size >= 100 * 1024) { 3 //找到可用空间 4 memman.free[i].addr += 100 * 1024; 5 memman.free[i].size -= 100 * 1024; 6 } 7 }
释放内存时,增加1条可用信息,frees加1。而且还要看看新释放出的内存与相邻的内存能不能连到一起,如果可以,就要归为1条。
与上文的最简单的方法相比,这种列表管理的方法,占用内存少,且内存的申请和释放更迅速。
缺点是释放内存的代码比较复杂。另外,如果内存变成零零碎碎的,那么需要的MEMMAN里的数组就会超过1000,这是个问题。如果真发生这种情况,只能将一部分零碎的空闲内存都视作被占用的,然后合并。
1 void memman_init(struct MEMMAN *man) 2 { 3 man->frees = 0; /* 可用信息数目 */ 4 man->maxfrees = 0; /* 用于观察可用状况:frees的最大值 */ 5 man->lostsize = 0; /* 释放失败的内存的大小总和 */ 6 man->losts = 0; /* 释放失败次数 */ 7 return; 8 } 9 10 unsigned int memman_total(struct MEMMAN *man) 11 /* 报告空余内存大小的合计 */ 12 { 13 unsigned int i, t = 0; 14 for (i = 0; i < man->frees; i++) { 15 t += man->free[i].size; 16 } 17 return t; 18 } 19 20 unsigned int memman_alloc(struct MEMMAN *man, unsigned int size) 21 /* 分配 */ 22 { 23 unsigned int i, a; 24 for (i = 0; i < man->frees; i++) { 25 if (man->free[i].size >= size) { 26 /* 找到了足够大的内存 */ 27 a = man->free[i].addr; 28 man->free[i].addr += size; 29 man->free[i].size -= size; 30 if (man->free[i].size == 0) { 31 /* 如果是free[i]变成了0,就减掉一条可用信息 */ 32 man->frees--; 33 for (; i < man->frees; i++) { 34 man->free[i] = man->free[i + 1]; /* 代入结构体 */ 35 } 36 } 37 return a; 38 } 39 } 40 return 0; /* 没有可用空间 */ 41 } 42 43 int memman_free(struct MEMMAN *man, unsigned int addr, unsigned int size) 44 /* 释放 */ 45 { 46 int i, j; 47 /* 为便于归纳内存,将free[]按照addr的顺序排列 */ 48 /* 所以,先决定应该放在哪里 */ 49 for (i = 0; i < man->frees; i++) { 50 if (man->free[i].addr > addr) { 51 break; 52 } 53 } 54 /* free[i - 1].addr < addr < free[i].addr */ 55 if (i > 0) { 56 /* 前面有可用内存 */ 57 if (man->free[i - 1].addr + man->free[i - 1].size == addr) { 58 /* 可用与前面的可用内存归纳到一起 */ 59 man->free[i - 1].size += size; 60 if (i < man->frees) { 61 /* 后面也有 */ 62 if (addr + size == man->free[i].addr) { 63 /* 也可以与后面的可用内存归纳到一起 */ 64 man->free[i - 1].size += man->free[i].size; 65 /* man->free[i]删除 */ 66 /* free[i]变成0后归纳到前面去 */ 67 man->frees--; 68 for (; i < man->frees; i++) { 69 man->free[i] = man->free[i + 1]; /* 结构体赋值 */ 70 } 71 } 72 } 73 return 0; /* 成功完成 */ 74 } 75 } 76 /* 不能与前面的可用空间归纳到一起 */ 77 if (i < man->frees) { 78 /* 后面还有 */ 79 if (addr + size == man->free[i].addr) { 80 /* 可用与后面的内容归纳到一起 */ 81 man->free[i].addr = addr; 82 man->free[i].size += size; 83 return 0; /* 成功完成 */ 84 } 85 } 86 /* 既不能与前面归纳到一起,也不能与后面归纳到一起 */ 87 if (man->frees < MEMMAN_FREES) { 88 /* free[i]之后的,向后移动 */ 89 for (j = man->frees; j > i; j--) { 90 man->free[j] = man->free[j - 1]; 91 } 92 man->frees++; 93 if (man->maxfrees < man->frees) { 94 man->maxfrees = man->frees; /* 更新最大值 */ 95 } 96 man->free[i].addr = addr; 97 man->free[i].size = size; 98 return 0; /* 成功完成 */ 99 } 100 /* 不能往后移动 */ 101 man->losts++; 102 man->lostsize += size; 103 return -1; /* 失败 */ 104 }
总结
内存管理要结合GDT的设定进行。按段(Segment)设计的GDT,内存就得按段申请和回收。按页设计的GDT,额我不知道,以后再说。
内存管理需要的预备知识还包括"获取内存容量"、"禁止/启用高速缓存"、"数据结构-链表"。
内存管理的算法还有很多,本篇只给出了两种最基本最简单的,够做个简易的OS就行了,现在不是深究算法的时候。