编译和执行区别 c语言,C语言编译和执行分析

学过编程都知道,在所有高级编程语言中,C是运行最高效的语言, 一个重要原因是C语言是静态型语言,会直接被编译成机器码,然后被计算机直接运行。和大部分人一样,做对C语言编译之后的运行方式的充满了好奇,主要包括一下几个方面:

可执行程序是什么,里面只是包括一大堆机器码吗?

C语言中定义变量, 常量, 函数等等,在内存中是如何分布的,它们之间是靠什么相互访问的?

计算机当中,同时运行的进程非常多,每个进程都占用内存空间,程序编译的时候,如何知道自己运行时将要被加载到哪里,又如何被CPU执行?

下面是一段简单的C程序:

#include

int a = 10;

int main(){

printf("The a is %d\n",a);

return 0;

}

用gcc编译, 运行会打印出”The a is 10″,这就是一个可执行文件,查资料得知linux下可执行文件为elf格式他有三种不同的类型:可重定位的目标文件、可执行文件和共享库。用readelf工具查看次文件的头信息:

[root@hitoy ~]# readelf -h a.out

ELF Header:

Magic: 7f 45 4c 46 01 01 01 00 00 00 00 00 00 00 00 00

Class: ELF32

Data: 2’s complement, little endian

Version: 1 (current)

OS/ABI: UNIX – System V

ABI Version: 0

Type: EXEC (Executable file)

Machine: Intel 80386

Version: 0x1

Entry point address: 0x8048310

Start of program headers: 52 (bytes into file)

Start of section headers: 1980 (bytes into file)

Flags: 0x0

Size of this header: 52 (bytes)

Size of program headers: 32 (bytes)

Number of program headers: 8

Size of section headers: 40 (bytes)

Number of section headers: 30

Section header string table index: 27

所以可以得出结论,可执行文件存放的不只是可执行的机器码,还包括其它一些说明和帮助程序运行的信息,linux下一个可执行的elf文件的结构如下:

e8d5bcf3f9d67579bdf278dba15d4ad1.png

ELF可执行文件格式

ELF Header描述了体系结构和操作系统等基本信息,并指出Section Header Table和Program Header Table在文件中的什么位置, Program Header Table记录文件里segment的分布,segment里存放的是各个数据段(section)。Section Header Table中保存了所有Section的描述信息,通过Section Header Table可以找到每个Section在文件中的位置。在上面的ELF Header中,有一个入口地址(Entry point address),当程序运行时,CPU从这里开始执行,程序中不仅仅保存有入口地址,程序中的其它数据在编译之后都有一个确切的地址,这样CPU就可以访问了。

那么问题又来了,程序在编译的时候,并不确定自己将要在哪里运行,运行的环境可能还各不一样,例如有些计算机只有512MB内存,有些可达到4G,里面的地址管用吗?而且我们注意到,里面的地址都是线性连续的,内存刚好能分配这样一段空间?把上面的C程序中全局变量a的值改成11,重新编译,发现执行的入口地址和原来的一样!

实际上操作系统主要的功能之一就是内存管理, 现代操作系统普遍采用虚拟内存管理(Virtual Memory Management)机制,这需要处理器中的MMU(Memory Management Unit,内存管理单元)提供支持, 有了MMU的支持,内存地址可以划分为虚拟地址和物理地址, 当存在MMU支持时,CPU所有的寻址操作都会由MMU翻译成实际的物理地址,然后操作实际的内存。有了MMU,就可以保证程序中的地址连续,而不用关心实际数据在内存里的存放位置了, 也解释了为什么不一样的程序入口地址是一样的。

d2fb02c9ffd7753043a80a365a6541da.png

MMU工作原理

那么对于不同配置的计算机,多个程序同时执行时,这些地址够用吗?通常操作系统把虚拟地址空间划分为用户空间和内核空间, 对于同样的平台,它们的大小通常是确定了的, 例如x86平台的Linux系统虚拟地址空间是0x00000000~0xffffffff,前3GB(0x00000000~0xbfffffff)是用户空间,后1GB(0xc0000000~0xffffffff)是内核空间。也就是说不论你的x86机器内存是多少,对于一个程序来说,它的地址空间可以为3G,操作系统会根据内存的使用情况,进行动态管理。

参考资料

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值