【编译原理】预编译、编译、汇编与链接

1、前言

我们编写的程序代码是怎样运行起来的?到底运行的是什么内容?平时我们所说的编译主要包括预编译、编译、汇编与链接,这四部分分别都干什么工作,主要职能有哪些。
在这里插入图片描述
讲述编译之前,我们先要了解程序内存。一个由c/c++编译的程序占用的内存,大致分为以下几个部分:
1、栈区(stack): 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。
2、堆区(heap): 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。
3、全局区(静态区)(static)
4、文字常量区:常量字符串就是放在这里的。 程序结束后由系统释放
5、程序代码区:存放函数体的二进制代码。
在这里插入图片描述
Windows中以2:2划分内核、用户空间,Linux中以1:3划分内核、用户空间。

2、代码如何生成

围绕着内存,编译过程大概如下:
在这里插入图片描述

3、预编译:i

1.#define 宏文本替换
2.#include 递归展开头文件
3.#if #endif #elif 删除预编译指令
4.删除注释
5.添加行号和文本标识
6.保留 #pragma 编译器处理

4、编译:s

【编译阶段以一个.cpp或者.c文件为单元编译】
1.词法分析
2.语法分析
3.语义分析
4.代码优化 生成汇编代码

[inter x86]  //汇编代码
int a = 10;
mov dword ptr[a],0Ah //ptr[a] 对a地址解引用后得到a的内存 //0Ah 是10

5、 汇编: o

可重定位(重入)的二进制文件
Linux中ELF文件,bss段:段以符号起始,节省空间
bss段少了一个数据,和虚拟地址空间上的段不同意义。 (bss段中少的数据,位于COM块中)
强弱符号:强符号是已初始化的全局变量,弱符号是未初始化的全局变量【C++中无强弱符号之分】

强弱符号规则:
1.两强:重定义错误 //数据段不可以出现重名
2.一强一弱:选强符号作为所有地址
3.两弱:选字节数大的 <编译器处理>
在汇编完成前,不清楚是否存在强符号无法判断时,则将变量放入COM块中。

6、 链接

生成.exe文件 也是ELF文件,有头和.data、.text段等
//UND 未定义区 //找不到
1.段合并:相同段合并<一个段映射一个页面>
合并符号表:同名查找,未找到则用本身查找的弱符号,找到则删除弱符号改用强符号
2.符号解析(处理UND):未找到对应的符号进行报错 合并UND
3.分配地址和空间
4.符号的重定位 //test段 <虚假地址改真实,纠正虚假偏移>
链接代码:[ld -e main -o run main.o sum.o]

7、例子

【Linux】中关于预编译、编译、汇编、链接的代码
1.[预编译] gcc -E Aff.c -o main.i
[ls] Aff.c main.i
2.[编译]gcc -S main.i -o main.s
[ls]Aff.c mian.i main.s
3.[汇编]gcc -C mian.s -o main.o
[ls]Aff.c mian.i main.s main.o a.out
4.[链接]/a.out //此时是.exe文件(可执行文件)

加入我们

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值