李志军 x86指令架构操作系统学习笔记

偷偷儿

已于 2024-07-16 11:45:36 修改

阅读量1.5k

点赞数 34

文章标签：学习笔记

于 2024-07-16 11:44:31 首次发布

本文链接：https://blog.csdn.net/weixin_39408609/article/details/138231514

版权

课程L1 L2

1. 何为实模式、保护模式？

参考链接：链接 1

CPU的实模式和保护模式(一) - 知乎

【构建操作系统】全局描述符表GDT - 知乎

小结：实模式，即直接访问物理实际地址，模型为

段基址+左移4位 +段偏移

形如

数据段+左移4位+ 通用寄存器值 = 数据地址
栈段SS+左移4位 + SP = 栈地址

之所以左移4位，是因为早期cpu寄存器是16位的，地址线有20位。直接存不下物理地址

保护模式，cpu32位，地址32位，可以访问更大地址空间，和进行段地址权限控制，模型改动为，段寄存器存全局描述符表(GDT)的表项的索引值。表项存段基址

2. test.c test.i test.s test.o test.exe ?

小结：

预处理阶段。编译器首先对源代码进行预处理，处理以“#”开头的预处理指令，如“#include”和“#define”。预处理器根据这些指令修改源代码，生成一个扩展名为“.i”的预处理后的文件。

编译阶段。在编译阶段，编译器将预处理后的文件翻译成汇编代码，生成以“.s”结尾的汇编文件。这一阶段包括词法分析、语法分析、语义分析、中间代码生成、优化，最终生成与特定计算机体系结构相对应的汇编语言代码。

汇编阶段。汇编器将汇编代码翻译成机器代码，生成以“.o”结尾的目标文件。这一阶段的输出是二进制文件，其中包含可执行的机器指令。

链接阶段。链接器将目标文件和必要的库文件合并成一个完整的可执行文件。链接器负责解决外部函数和变量的引用，并确保不同的代码段（如指令和数据）正确地链接在一起。

即 test.i 称为预处理后的文件，test.s称为汇编代码具有段格式。test.o称为链接可重定位文件具有段格式，二进制格式。

3. 为什么分段及基本内存布局？

参考《深入理解计算机》，“链接” 篇章

小结：最终的可执行文件是分段的，数据段，代码段。分段的好处在与将数据归类便于查找和加载到内存中。只是因为cpu 段寄存器的存在导致了内存在逻辑上的分段，不存在物理分段。

分多个段是因为一个段偏移寄存器表示范围只有16位

P2小结：上电后执行bios,加载bootseg后，bootseg将

1.setup及其剩余的操作系统代码加载到内存，

2.打印启动日志，
3.将控制权交到setup

实验二：操作系统的引导

1.为什么在屏幕上显示字符串要读取光标的位置？

参考：c获取光标位置_一步步编写操作系统 75 从显卡读取光标位置1-CSDN博客
即显示字符串本质上不需要读取光标位置，只跟显存有关，但加上这个操作是为了引导用户看见

利用 BIOS INT 0x10 功能 0x03 和 0x13 来显示信息：“'Loading'+回车+换行”，显示包括

! 回车和换行控制字符在内共 9 个字符。

! BIOS 中断 0x10 功能号 ah = 0x03，读光标位置。

! 输入：bh = 页号

! 返回：ch = 扫描开始线；cl = 扫描结束线；dh = 行号(0x00 顶端)；dl = 列号(0x00 最左边)。

! BIOS 中断 0x10 功能号 ah = 0x13，显示字符串。

! 输入：al = 放置光标的方式及规定属性。0x01-表示使用 bl 中的属性值，光标停在字符串结尾处。

! bh = 显示页面号；bl = 字符属性；dh = 行号；dl = 列号。cx = 显示的字符串字符数。

! es:bp 此寄存器对指向要显示的字符串起始位置处。

2. 为什么增加对es的处理？

答：es:bp 为读取的msg地址，设置为 #0x07c0（系统加载boot的默认位置），而非 #9000（boot将自己重复制到的位置）是因为本实验的目的只涉及打印。
boot的基本流程：
Linux 的最前面部分是用 8086 汇编语言编写的（boot/bootsect.S），并保存在引导设备的第一个扇区中。它将由 BIOS 读入到内存绝对地址 0x7C00（31KB）处。当它被执行时就会把自己移动到内存绝对地址 0x90000（576KB）处，并把启动设备盘中后 2KB 字节代码（boot/setup.S）读入到内存 0x90200 处。而内核的其他部分（system 模块）则被读入到从内存地址 0x10000（64KB）开始处。

3. 为什么设置引导扇区标志（ .org508）？

答：3.1 org的概念

ORG 2000H 　　
START：MOV AX，#00H
汇编语言源程序中若没有ORG伪指令，则程序执行时，指令代码被放到自由内存空间的CS:0处；若有ORG伪指令，编译器则把其后的指令代码放到ORG伪指令指定的偏移地址。两个ORG伪指令之间，除了指令代码，若有自由空间，则用0填充。

3.2 .word 的概念

答：举例来说，
_rWTCON:
.word 0x15300000
就是在当前地址，即_rWTCON处放一个值0x15300000

翻译成intel的汇编语句就是：
_rWTCON dw 0x15300000

3.3 boot_flag的规定

答：规定必须位于引导扇区的最后两个字节
3.4 暂不加载文件系统？

4. 复习从指定扇区磁道读字节码

答：

BIOS 提供的访问磁盘的中断例程为 int 13h。读取 0面0道1扇区的内容到0:200的

程序如下所示。

mov ax,0

mov es,ax

mov bx,200h

mov al,1

mov ch,0

mov cl,1

mov dl,0

mov dh,0

mov ah,2

int 13h 入口参数：

第17章使用 BIOS进行键盘输入和磁盘读写

(ah)=int 13h的功能号(2表示读扇区)

(al)=读取的扇区数

(ch)=磁道号

(cl)=扇区号

(dh)=磁头号(对于软盘即面号，因为一个面用一个磁头来读写)

(dl)=驱动器号软驱从0开始，0:软驱 A,1:软驱 B;

硬盘从 80h开始，80h:硬盘C,81h:硬盘D

es:bx 指向接收从扇区读入数据的内存区

返回参数：

操作成功：(ah)=0,(al)=读入的扇区数

操作失败：(ah)=出错代码

5. rol指令

rol，汇编语言指令，功能是把目的地址中的数据循环左移COUNT次，每次从最高位（最左）移出的数据位都补充到最低位（最右），最后从最高位（最左）移出的数据位保存到CF标志位。

6. bootsect.s 在当前页光标处打印字符的核心代码

! 读取光标位置
mov ah,#0x03 !三号功能
xor bh,bh !参数传递第0面
int 0x10

! 显示字符串到光标位置
mov cx,#36 !显示多少个字符
mov bx,#0x0007 !bh 显示页面号，bl 字符属性
mov bp,#msg1
mov ax,#0x07c0
mov es,ax !es:bp 为读取的位置
mov ax,#0x1301 !ah=0x13 对应功能号，al=0x01为启用bl
int 0x10

inf_loop:
jmp inf_loop

msg1:
.byte 13,10
.ascii "Hello os world, my name is dcw"
.byte 13,10,13,10
.org 510 !boot_flag必须位于引导扇区最后两个字节
boot_flag:
.word 0xAA55

最后效果

7.从磁盘中读取setup.s到内存，并跳转setupseg

load_setup:
   mov dx, #0x0000 !设置设备号和磁头（那一面）
   mov cx, #0x0002 !设置扇区号和磁道号
   mov bx, #0x0200 ! es:bx 为写入内存位置，BOOTSEG + 512字节
   mov ax, #0x0200 + SETUPLEN !ah=0x02功能号，al = 0x02 读取的磁道数
   int 0x13
   jnc ok_load_setup

ok_load_setup:
   jmpi 0,SETUPSEG
   mov dx, #0x0000
   mov ax, #0x0000 ! 复位软驱重新读取
   int 0x13
   jmp load_setup

setup.s 可暂时只打印字符同早期bootseg.s
效果图

8. 后续内容为在setup.s 打印硬件参数核心代码为 16进制为字符转换、在光标处打印字符，与上雷同可暂时略过。

课程L3 L4 L5

1.为什么跳转到systemseg 前启动保护模式？

答：因为保护模式的寄存器访存为32位，约4GB。比实模式 16位左移加偏离为 20位约 1MB大得多。

2. 根据gdt表项寻址

答：

2.1 在保护模式仍为段基址 + 偏移，不过段基址保存在gdt表项中。段寄存器表示表项的索引。

2.2 段寄存器为 16位，在保护模式下的含义如下：

则 jmpi 0,8 即 8:0, 0x8, 高13位表示index = 1

2.3 如gdt表项图段基址共占 32位，需要对号入座后需要拼接在一起，

limit_low = 0x07FF

base_low = 0x000000 前24位

base_high = 0x00
2.4 则最后的线性地址为 0x00000000 + 0x0000

3. 宏展开

答：

参考 C语言之宏详解（超级详细！）_c语言宏-CSDN博客

4. 内联汇编

答：参考 C语言内联汇编-CSDN博客

实验3 系统调用

1.对设置IDT表项的内联汇编的解释

答：

__asm__ (

"movw %%dx,%%ax\n\t" \

"movw %0,%%dx\n\t" \

"movl %%eax,%1\n\t" \

"movl %%edx,%2" \

: \

: "i" ((short) (0x8000+(dpl<<13)+(type<<8))), \ 0x8000 + 0x6000 + 0x0f00

"o" (*((char *) (gate_addr))), \ &idt[0x80]

"o" (*(4+(char *) (gate_addr))), \ &idt[0x80] + 4

"d" ((char *) (addr)),"a" (0x00080000)) edx = &systemcall, eax = 0x00080000

1.
edx = &systemcall, eax = 0x00080000
2.

ax = dx = &systemcall的低16位

dx = 0x8000 + 0x6000 + 0x0f00

&idt[0x80] = eax,表项的低32位

&idt[0x80] + 4 = edx，4字节即表项的高32位。

3.

由此可知idt[0x80]被置为：
0~15位，偏移值低16位，&systemcall的低16位
16~31位，段选择子，0x0008
32~47位，属性值，0x0x8000 + 0x6000 + 0x0f00，其中p = 1, dpl= 11

48~63位，偏移值高16位，0x0000

2.系统调用小结：

为什么调用系统api函数时，需要调用触发int 0x80？
答：从上文初始化idt表项可知，会将

1.dpl改为3

2.段选择子置为0x8，则cpl 为0,

3. 段偏移为 systemcall.s 的地址，则可gpt寻址到内核代码systemcall了。

4. systemcall.s里就会根据触发int 0x80的同时在eax中保存的系统调用号，查找数组，执行到最终的系统函数了。

3. 添加系统函数的步骤

答：从系统调用原理可知

1. 编写api，在对应头文件的添加宏定义

如在linux-0.11/lib下添加test.c

在 include/unistd.h中添加宏定义

2. 实现函数功能，并修改 system_call对应数组

修改include/linux/sys.h 中的system_call_table数组

实现函数

在 kenel下实现who.c

知识点：用户态和内核态传递数据，官方实验提示仅告知从已有库函数抄

函数实现如下

#include <asm/segment.h>
#include <errno.h>
#include <string.h>

char _myname[24];

int sys_iam(const char *name)
{
char str[25];
int i = 0;

do
{
// get char from user input
str[i] = get_fs_byte(name + i);
} while (i <= 25 && str[i++] != '\0');

if (i > 24)
{
errno = EINVAL;
i = -1;
}
else
{
// copy from user mode to kernel mode
strcpy(_myname, str);
}

return i;
}

int sys_whoami(char *name, unsigned int size)
{
int length = strlen(_myname);
printk("%s\n", _myname);

if (size < length)
{
errno = EINVAL;
length = -1;
}
else
{
int i = 0;
for (i = 0; i < length; i++)
{
// copy from kernel mode to user mode
put_fs_byte(_myname[i], name + i);
}
}
return length;
}

3. 调用api测试

这里可引入api文件，或直接api里直接写main

oslab下添加

/* iam.c */
#define __LIBRARY__
#include <unistd.h>
#include <errno.h>
#include <asm/segment.h>
#include <linux/kernel.h>
_syscall1(int, iam, const char*, name);

int main(int argc, char *argv[])
{
/*调用系统调用iam()*/
iam(argv[1]);
return 0;
}

/* whoami.c */
#define __LIBRARY__
#include <unistd.h>
#include <errno.h>
#include <asm/segment.h>
#include <linux/kernel.h>
#include <stdio.h>

_syscall2(int, whoami,char *,name,unsigned int,size);

int main(int argc, char *argv[])
{
char username[64] = {0};
/*调用系统调用whoami()*/
whoami(username, 24);
printf("%s\n", username);
return 0;
}