当我们认识汇编语言后,编写代码虽然有所简单。
但是汇编语言是带有每个平台的特点,例如在Intel和在AMD上写汇编就是两种风格,因此,我们就需要进一步的抽象化,摆脱汇编语言依赖于平台的束缚。
在这样的背景下诞生高级语言,而第一门高级语言为C语言。
那么我就需要更加了解汇编语言,才能对汇编语句进行抽象,屏蔽一些平台的差异性。
这里我推荐一本书叫《汇编语言基于x86处理器》
我们来首先看一下目录结构:
如上两张图,我们可以观察到。
汇编语言的重点在于
访问内存,控制CPU,对数据进行操作。而其他的特点则是在实际编码中在特定场景下才会遇到。
所以基于如上信息我们开始对汇编语言进行抽象。
现在我们需要操作的是内存。
就需要对内存的存储进行充分的认识。
内存是用于存储数据而存在的,那么他是存储的单位是什么?答:字节
一个字节 = 8 bit
那为什么 一个字节 = 8bit ,而不是7 bit 或者是 10 bit?
如果计算机完全以二进制工作,并且只对二进制数字进行了计算,那么就不会有字节。但如果要使用字符,我们就必须对这些符号进行编码。
最初,我们只需要处理整数运算,所以只需要编码0-9十个字符,再加上运算符,4bit就够了。后来又需要处理字母,大小写字母加上数字,再加上例如逗号等标点符号,这时大概有了70多个字符,需要7bit。
而之所以最后确定8bit是1字节,而不是7bit,可能是因为当时IBM的360系统使用8位字符,并且byte这个词被大量使用,且8是2的幂次方,比7更加适合2进制的计算机,所以最后大家就都接受了1byte=8bit。
所以对于一门语言的设计:
- 类型系统:屏蔽了对内存的单元的尺寸大小。使用类型表示当前类型可以存放多大的数据。做统一的规定。
- 抽象数据操作
- 添加语言自身的特性
- 类型系统
- byte 字节
- char 字符类型
- short 短整型
- int 整型
- long 长整型
- boolean 布尔
- float 单精度浮点型
- double 双精度浮点型
在数据存储类型中,我们可以这么分:
类型相同的数据:C语言的数组
类型不同的数据:C语言的结构体
- 对数据操作的抽象
- + * / = 等 同理可得:if for while 的推理是对汇编语言 jump loop 指令的抽象。
- 添加语言自身的特性
如此说来 C语言是一门最纯粹的语言。没有语言特性。比如Java,C++,Python等语言都有自己的特性。
现在来说语言没有好坏之分,语言被设计出来只是为了满足不同场景下的需要。
参考文献
《汇编语言基于x86处理器》