编译型语言和解释型语言篇章
1.前言
1.1 高级语言分类
计算机高级语言按 程序的执行方式 可分为:编译型和解释型。
1.2 人类与计算机的认知
对象 | 能识别的语言 |
---|---|
人类 | 高级语言 |
计算机 | 二进制指令,即“机器码” |
由上图可知,计算机只能识别某些特定的二进制指令,在程序真正运行之前必须将高级语言的源代码转换成二进制指令。
2. 定义
- 将
所有源代码
一次性转换成二进制指令,也就是生成一个可执行程序(如Windows 下的 .exe),比如C语言、C++、Golang、Pascal(Delphi)、汇编等,这种编程语言称为 编译型语言 ,使用的转换工具称为 编译器。 - 一边执行一边转换,需要哪些源代码就转换哪些源代码,不生成可执行程序,比如 Python、JavaScript、PHP、Shell、MATLAB 等,这种编程语言称为 解释型语言,使用的转换工具称为 解释器。
- 半编译半解释型语言:既用了解释器也用编译器,如 Java 和 C## 。源代码需要先转换成一种中间文件(字节码文件),然后再将中间文件拿到虚拟机中执行。Java 引领了这种风潮,它的初衷是在跨平台的同时兼顾执行效率;C## 是后来的跟随者,但是 C## 一直止步于 Windows 平台,在其它平台鲜有作为。
以Java为例,如下图所示,Java编译器先把Java编译成Class文件,然后在各个JVM上解释执行,由于每个平台对应一个JVM,因此Java是跨平台的。
3. 编译型语言和解释型语言的特点
3.1 编译型语言
- 编译型语言经过编译器转成可执行程序后,可执行程序里面包含的就是机器码。只要拥有可执行程序,就可以随时运行,不用再重新编译了,即 一次编译,无限次运行。
- 运行可执行程序时,不再需要源代码和编译器,因此编译型语言可以脱离开发环境运行。
- 编译型语言一般不能跨平台,即不能在不同的操作系统之间随意切换。
编译器的类型:前端编译器、后端编译器。
1.编译器的分析阶段也称为前端,它将程序划分为基本的组成部分,检查代码的语法、语义和语法,然后生成中间代码。分析阶段包括词法分析、语义分析和语法分析。
2.编译器的合成阶段也称为后端,优化中间代码,生成目标代码。合成阶段包括代码优化器和代码生成器。
3.2 解释型语言
- 解释型语言,每次执行程序都需要一边转换一边执行。
- 因为每次执行程序都需要重新转换源代码,所以无法脱离开发环境,所以解释型语言的执行效率天生就低于编译型语言,甚至存在数量级的差距。
- 解释型语言 能跨平台,即实现“一次编写,到处运行”
3.3 总结对比
类型 | 原理 | 优点 | 缺点 |
---|---|---|---|
编译型语言 | 通过专门的编译器,将所有源代码一次性转换成特定平台(Windows、Linux 等)执行的机器码(以可执行文件的形式存在)。 | 编译一次后,脱离了编译器也可以运行,并且运行效率高。 | 可移植性差,不够灵活。 |
解释型语言 | 由专门的解释器,根据需要将部分源代码临时转换成特定平台的机器码。 | 跨平台性好,通过不同的解释器,将相同的源代码解释成不同平台下的机器码。 | 一边执行一边转换,效率很低。 |
4. 编译器和解释器对比
编译器(compare) | 解释器(Interpreter) | 备注 | |
---|---|---|---|
程序步骤 | 1、创建代码 | 1、创建代码 | |
输入(Input) | 整个程序 | 每次读取一行 | |
输出(Output) | 生成中间目标代码 | 不产生任何的中间代码 | |
工作机制 | 编译在执行之前完成 | 编译和执行同时进行 | |
存储 | 存储编译后的机器代码在机器上 | 不保存任何机器代码 | |
执行 | 程序执行与编译是分开的,它只在整个输出程序编译后执行 | 程序执行是解释过程的一部分,因此是逐行执行的 | |
生成程序 | 生成可以独立于原始程序运行的输出程序(以exe的形式) | 不生成输出程序,所以他们在每次执行过程中都要评估源程序 | |
修改 | 如果需要修改代码,则需要修改源代码,重新编译 | 直接修改就可运行 | |
运行速度 | 快 | 慢 | |
内存 | 内存需求更多的是由于目标代码的创建 | 它需要较少的内存,因为它不创建中间对象代码 | 由于要生成目标代码,编译器比解释器需要更多的内存 |
错误 | 编译器在编译时显示所有错误和警告。因此,不修正错误就不能运行程序 | 解释器读取一条语句并显示错误(如果有的话)。你必须纠正错误才能解释下一行 | 在编译器中,当程序中出现错误时,它会停止翻译,并在删除错误后重新翻译整个程序。相反,当解释器中发生错误时,它会阻止其翻译,在删除错误后,翻译将继续 |
错误监测 | 难 | 容易 | 编译器同时显示所有错误,很难检测错误,而解释器则逐个显示每条语句的错误,更容易检测错误 |
编程语言 | C语言、C++、Golang、Pascal(Delphi)、汇编等 | Python、JavaScript、PHP、Shell、MATLAB 等 |
5. 补充与思考
5.1 解释型语言为什么能跨平台?
解释型语言的跨平台,指的是源代码跨平台,而不是解释器跨平台。
解释器是一个将源代码转换成机器码的可执行程序,可执行程序是不能跨平台的。 因此官方需要针对不同平台开发不同的解释器,这些解释器必须要能够遵守同样的语法,识别同样的函数,完成同样的功能。
因为有了解释器这个中间层,解释器帮助我们屏蔽了不同平台之间的差异。在不同的平台下,不同的解释器会将相同的源代码转换成不同的机器码,所以才让同样的代码在不同平台的执行结果相同。
5.2 编译型语言为什么不能跨平台?
既然解释型语言依靠不同平台的解释器就可以实现跨平台,如果在不同平台上装对应的编译器,不也可以实现跨平台吗?
编译型语言不能跨平台表现在两个方面:
1) 可执行程序不能跨平台
编译器将编译型语言编译生成可执行程序,这个可执行程序不能跨平台。因为不同操作系统对可执行程序的内部结构有着截然不同的要求,彼此之间也不能兼容。 比如,不能将 Windows 下的可执行程序拿到 Linux 下使用,也不能将 Linux 下的可执行程序拿到 Mac OS 下使用(虽然它们都是类 Unix 系统)。
另外,相同操作系统的不同版本之间也不一定兼容。 比如不能将 x64 程序(Windows 64 位程序)拿到 x86 平台(Windows 32 位平台)下运行。但是反之一般可行,因为 64 位 Windows 对 32 位程序作了很好的兼容性处理。
2) 源代码不能跨平台
不同平台支持的函数、类型、变量等都可能不同,基于某个平台编写的源代码一般不能拿到另一个平台下编译。以C语言为例,
示例 | Windows平台 | Linux 平台 |
---|---|---|
“睡眠”函数 | Sleep(x),x为毫秒 | sleep(x),x为秒 |
long 类型的长度 | (64 位)占 4 字节 | (64 位)占8 字节 |
编译型语言虽然是高级语言,却与平台联系比较紧密(操作系统都是用编译型语言编写的),针对不同平台(操作系统)可能有其特定的编写规则。因此编译型语言不能像解释型语言一样,实现源代码跨平台。
5.3 编译型语言运行一定比解释型语言快?
编译型语言经过编译后,就运行效率而言,编译型语言 > 解释型语言,因为解释性语言每次运行都需要解释器来进行逐行解释。但是编译型程序的编译加执行的时间可能比解释性语言解释执行的时间多。
动(静)态语言 、动(静)态类型语言、强(弱)类型语言篇章(未完待续)
1.前言
编程语言分类
编程语言按照不同的分类标准可以分为以下几类:
2.定义
名称 | 定义 | 举例 | 优势 | 劣势 | 编程语言 | |
---|---|---|---|---|---|---|
动态语言 Dynamic Programming Language | 一类在运行时可以改变其结构的语言。(强调改变代码结构) | 例如新的函数、对象、甚至代码可以被引进,已有的函数可以被删除或是其他结构上的变化。 | / | / | Object-C、C#、JavaScript、PHP、Ruby、Python、Erlang。 | |
静态语言 Statical Programming Language | 与动态语言相对应的,运行时结构不可变的语言就是静态语言。(强调改变代码结构) | / |
| / | Java、C、C++。 | |
动态类型语言 Dynamically Typed Language | 在运行时,确认数据类型的语言,变量在使用之前无需申明类型,通常变量的值是被赋值的那个值的类型。(强调检查数据类型) | 伪代码:
| 1.思维不受束缚,可以任意发挥,把更多的精力放在产品本身。 2.集中思考业务逻辑实现,思考过程即实现过程。 | 代码运行期间有可能会发生与类型相关的错误。 | PHP、ASP、JavaScript、Python、Perl、SQL、Ruby、ABAP、Unix Shell等。 | |
静态类型语言 Statically Typed Language | 在编译时,变量的数据类型就可以确定的语言。 多数静态类型语言要求在使用变量之前必须声明数据类型。(强调检查数据类型) | 伪代码:
| 1.由于类型的强制声明,IDE(集成开发环境)有很强的代码感知能力,因此,在实现复杂的业务逻辑,开发大型商业系统,以及那些生命周期很长的应用中,依托IDE对系统的开发很有保障。 2.由于静态类型语言相对比较封闭,使得第三方开发包对代码的侵害性可以降到最低 | 1.开发代码的时候,需要格外注意变量的类型。 2.过多的类型声明会增加更多的代码 | C、C++、Java、Delphi、C#等。 | |
强类型语言 Strongly Typed Language | 强制数据类型定义的语言。 一旦一个变量被指定了某个数据类型,如果不经过强制转换,那么它就永远是这个数据类型。(强调转换数据类型) | 例如,不能把一个整形变量当成一个字符串来处理。 | 强类型定义语言在速度上可能略逊色于弱类型定义语言,但是强类型定义语言带来的严谨性能够有效的避免许多错误。 | Java、C#、Python、Object-C、Ruby | ||
弱类型语言 Weakly Typed Language | 数据类型可以被忽略,一个变量可以赋不同数据类型的值。(强调转换数据类型) | 一个变量可以赋不同数据类型的值。 | JavaScript、PHP、C、C++(C 和 C++ 有争议,但是确实可以给一个字符变量赋整形值,可能初衷是强类型,形态上接近弱类型) |
3.补充与思考
3.1 静态语言=编译型语言,动态语言=解释型语言?
既然编译型语言需要将所有源代码一次性转换成可执行程序,解释型语言是逐行解释每一句源代码,是否意味着编译型语言就是静态语言,代码结构无法改变;而解释型语言因为是逐行运行可以随意改变未运行源代码的代码结构呢?
反例:Object-C 是编译型语言,但是他是动态语言。得益于特有的 run time 机制(准确说 run time 不是语法特性是运行时环境,这里不展开)OC 代码是可以在运行的时候插入、替换方法的。
3.2 静态类型语言=强类型语言,动态类型语言=弱类型语言?
既然静态类型语言在使用变量之前必须声明数据类型,而强类型语言一旦一个变量被指定了某个数据类型,如果不经过强制转换,那么数据类型永远不变。是否意味着静态类型语言=强类型语言?再有,动态类型语言的变量在使用之前无需申明类型,通常变量的值是被赋值的那个值的类型,而弱类型语言的一个变量可以赋不同数据类型的值。是否意味着动态类型语言=弱类型语言?
一个语言是不是强类型语言和是不是动态类型语言也没有必然联系。 如下图,Python 是动态类型语言,是强类型语言。JavaScript 是动态类型语言,是弱类型语言。Java 是静态类型语言,是强类型语言。
参考:
编译型语言和解释型语言的区别
解释器( interpreter ) 与 编译器( compiler ) 的对比
编译器和解释器各有什么特点与区别
漫谈计算机语言
编译型语言、解释型语言、静态类型语言、动态类型语言概念与区别
解释型语言可以跨平台而编译型语言不行
动态语言和静态语言的区别(如python与c++)