c语言可执行的程序吗,C语言从源程序到可执行程序

最新推荐文章于 2023-11-16 13:16:51 发布

佘炤灼

最新推荐文章于 2023-11-16 13:16:51 发布

阅读量349

点赞数

文章标签： c语言可执行的程序吗

一.0,1、文本信息和字符编码

所有的信息在计算机中都是以0、1及其组合形式存在。文本信息也不例外。

文本信息是以人类容易理解的方式来呈现信息。

计算机是在美国诞生的，英文26个字母加上其他符号只有128个，只用7个bit便可以完全表示所有符号。用8个bit，及一个byte来表示一个符号的方式就叫做ascii编码。对应的有ascii码表。

比如说要在计算机中表示"i love you"这个信息，采用ascii编码方式，那么在计算机中，那就是69 20 6c 6f 76 65 20 79 6f 75(hex)

但是在其他国家，符号远远多于128个，8个bit远远不够表达所有的符号，于是便有了其他编码方式，像中国的gb2312汉字编码。当然，其他编码方式表达一个符号的字节不一定是8个bit。不同编码国家都有自己的编码方式，不同编码之间的信息之间都要转换。

为了解决这个问题，unicode编码出现了。unicode自身也存在问题。

utf编码作为一种unicode的实现方式，解决了unicode的问题。

utf8用一个字节表示一个字符。utf16用2或者4个字节表示一个字符。utf32则用4个字节表示一个字符。

二.文本信息到可执行程序

不论是.c, .cpp 还是.h文件，所有的这些我们称之为程序的东西都是文本信息。他们都无法被计算机认识。计算机只认识0和1.所以要让计算机执行我们用文本信息表示的程序，必须将这些文本信息表示的程序翻译成计算机认识的01代码串。

在linux下，以helloworld.c为例，使用gcc编译器，这个翻译过程一般分为以下四个步骤：

1).preprocessing预处理。

预处理过程会把所有包含的头文件的具体内容插入到指定位置，并把所有的宏展开。gcc下，用

gcc helloworld.c -o helloworld.i -E

可以得到预处理后的文件helloworld.i

2)compilation编译

将预处理后的文件中的所有符号翻译为汇编语言表示的信息。不同的CPU有不同的汇编指令集。不同的编译器有不同的汇编语言表示方式。GCC下，用

gcc helloworld.c -o helloworld.s -S

可以得到编译后用gcc汇编语言表示的文本信息。

其中的每一条汇编语言指定在CPU硬件层都对应着特定的二进制01指令集。

3)assembling汇编

将用汇编语言表示的符号翻译成特定的硬件层支持的二进制01指令集。gcc下，用

gcc helloworld.c -o helloworld.o -c

可以得到汇编后的用01指令集表示的信息文件，我们称之为可重定位的目标文件。

4)linking链接

由于我们引用了别的库中的符号，我们需要将这些符号的二进制指令集以某种方式装入到我们程序中，最后经过一些处理后才得到了能被计算机识别的可执行程序。在linux下，是elf文件。

三. CPU的寻址能力/寻址范围

寻址能力就是CPU能查找的地址的最大范围。

CPU的寻址能力由地址总线的位数决定。

32-bit的CPU指CPU一次能处理指令长度为32bit。

1.平坦地址模式

平坦地址模式将整个存储空间看成一个大的数组，存储空间的地址是线性增长的。

2.虚拟地址空间

32-bit的CPU，虚拟地址空间范围从0到0xffffffff线性增长。我们在程序中操作内存时使用的是虚拟地址。操作系统负责将虚拟地址映射到物理地址空间。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。