机器语言-Machine Language
定义
- 机器语言指的是用二进制代码表示的计算机能直接识别和执行的一种机器指令的集合;
- 它是计算机设计者通过计算机的硬件结构赋予计算机的操作功能,所以不同型号计算机的机器语言是不相通的;
- 其编码称为:机器码(Machine Code)/原生码(Native Code);
- 使用者:计算机/CPU生产厂家的专业人员,绝对多数程序员不会再去学机器语言;
语句(指令)
- 一条指令就是机器语言的一个语句,它是一组有意义的二进制代码;
- 指令基本格式是:操作码段+地址码段
- 操作码:指明了指令的操作性质及功能
- 地址码:给出了操作数/操作数的地址
编程
- 首先我觉得用机器语言写程序有如下步骤:
- 首先,要选择一个CPU(准确说是选指令集,如IA-32),知道此ISA的所有指令的格式。
- 然后,按照业务需求,写01010101011010…..。
- 好了,现在你知道了,用机器语言写代码其实是扯淡的!
- 程序员首先要熟记所用计算机的全部指令代码机器含义;
- 程序员要自己指定每条指令的执行过程;
- 要考虑的东西太多,太繁琐,这一切会极大的消耗精力,这样你还怎么实现业务需求呢?
结论
1. 如果有人对你说:“你要是学会机器语言了那才如何如何牛逼..之类的巴拉巴拉”,请直接抽他丫的!
2. 机器语言不是让99.99%的程序员学的,知道它只是让你明白程序运行原理。
3. CPU开发商的开发人员确定了机器语言的语句(就是制定了指令),并且也只有他们才有必要用机器语言写一点东西。
一个C编译为汇编(机器语言的助记符)的例子
C程序运行过程
1.(C源代码)
我们有一个c代码文件code.c
int accum = 0;
int sum(int x,int y)
{
int t = x + y;
accum += t;
return t;
}
在一台IA32机器上用unix命令行编译
unix>gcc -01 -S code.c
这会使GCC(GNU Compiler Collection)运行编译器,产生一个汇编文件code.s
2(C编译成汇编文件,)
汇编文件code.s
sum:
pushl %ebp
movl %esp, %ebp
movl 12(%ebp), %eax
addl 8(%ebp), %eax
addl %eax, accum
popl %ebp
ret
以上代码中每个缩进的行都对应一条机器指令,即除了sum:
使用-c,GCC会编译并汇编该代码(但不链接)
unix>gcc -01 -c code.c
3.1(编译后但没链接的目标文件)
会产生目标代码文件code.o ,这是二进制格式
一条条的由二进制0/1构成的指令
3.2(编译并链接为可执行的目标文件)
生成实际可执行代码需要对一组目标代码文件运行链接器,且这组目标代码文件中必须有main函数,假设有这样一个main.c文件
int main()
{
return sum(1, 3);
}
生成可执行文件prog
unix> gcc -01 -o prog code.o main.c
此时prog.o中已经有了两个过程的代码,还包含了用来启动和终止程序的信息,以及用来与操作系统交互的信息;
百度百科中关于GUN编译C的过程示例代码
http://baike.baidu.com/subview/4848/6393900.htm
预编译过程
gcc -E a.c -o a.i
编译过程
这个阶段,生成汇编代码。
gcc -S a.i -o a.s
汇编过程
这个阶段,生成目标代码。
此过程生成ELF格式的目标代码。
gcc -c a.s -o a.o
链接过程
链接过程。生成可执行代码。链接分为两种,一种是静态链接,另外一种是动态链接。使用静态链接的好处是,依赖的动态链接库较少,对动态链接库的版本不会很敏感,具有较好的兼容性;缺点是生成的程序比较大。使用动态链接的好处是,生成的程序比较小,占用较少的内存。
gcc a.o -o a
程序运行
./a
hello