程序是由一系列的bit位组成,就拿最简单的hello.c的程序来说,是以字节序列的方式存储在文件中。每个字节都有一个整数值,对应某个字符(ASCII码)。像hello.c这样只由ASCII字符构成的文件,称为文本文件,所有其他文件则称为二进制文件。所以,计算机系统中只有这两类文件。
程序的生命周期:
hello.c(源程序)--->预处理--->编译器--->汇编器--->链接器--->可执行的二进制文件。
预处理阶段:处理以字符#开头的命令,修改原始的程序。比如处理#include指令,去调用相应的头文件。得到另一个程序,通常以.i作为扩展名。
编译阶段:编译器将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。
汇编阶段:汇编器将hello.s翻译成机器语言,将目标打包为一种叫做可重定位的目标程序格式,将结果保存在hello.o中。这是一个二进制文件,他的字节编码是机器语言指令而不是字符。
链接阶段:在hellow.c程序中调用了printf函数,,它存在于一个名为printf.o的单独预编译文件中,链接器负责将这个文件并入hello.o文件中,得到可执行文件,hello.exe。
存储设备的层次(由高到低):
寄存器--->L1--->L2--->主存--->外存
越高层,越小越快,越低层,价格越便宜。
虚拟存储器:
虚拟存储器是一个抽象概念,它为每个进程提供一个假象,独占内存。每个进程看到的存储地址都是一致的,称为虚拟地址空间.下图是Linux虚拟存储空间。顶层四分之一是预留给操作系统内核的,对外不可见
分为:程序代码和数据块,堆,共享库,栈,内核虚拟存储器。特别注意栈是由高位置到低位置申请使用的,比如从0x5000是栈底,调用一个函数,则入栈一个地址,存在0x4999,函数调用结束后,出栈,栈顶指针指回0x5000。