Java语言是一种特殊的高级语言,它既有编译型语言的特征,也有解释型语言的特征,因为Java程序要经过先编译、再解释执行这两个步骤。
计算机高级语言按程序的执行方式可以分为编译型和解释型两种。
编译型语言:
- 编译型语言是指使用专门的编译器,针对特定平台(操作系统)将某种高级语言源代码一次性翻译成可被该平台硬件执行的机器码(包括机器指令和操作数),并包装成该平台所能识别的可执行性程序的格式,这个转换过程称为编译(Compile)。编译生成的可执行性程序可以脱离开发环境,在特定的平台上独立运行。
- 有些程序编译结束后,还可能需要对其他编译好的目标代码进行链接,即组成两个以上的目标代码模块生成最终的可执行性程序,通过这种方式实现低层次的代码复用。
- 因为编译型语言是一次性地编译成机器码,所以可以脱离开发环境独立运行。而且通常运行效率较高。但因为编译型语言的程序被编译成特定平台上的机器码,因此,编译生成的可执行性程序通常无法移植到其他平台上运行;如果需要移植,则必须将源代码复制到特定平台上,针对特定平台进行修改,至少也需要采用特定平台上的编译器重新编译。
- 现有的C、C++、Objective-C、Swift、Kotlin等高级语言都属于编译型语言。
解释型语言:
- 解释型语言是指使用专门的解释器,对源程序逐行解释成特定平台的机器码并立即执行的语言,解释型语言通常不会进行整体性的编译和链接处理,解释型语言相当于把编译型语言中的编译和解释过程混合到一起同时完成( 额呃 ???)。
- 可以认为:每次执行解释型语言的程序都需要进行一次编译,因此解释型语言的程序运行效率通常较低,而且不能脱离解释器独立运行。但解释型语言有一个优势:跨平台比较容易,只需要提供特定平台的解释器即可,每个特定平台上的解释器负责将源程序解释成特定平台的机器指令即可。解释型语言可以方便地实现源程序级的移植,但这是以牺牲程序执行效率为代价的。
- 现有的JavaScript、Ruby、Python等语言都属于解释型语言。
除此之外,还有一种伪编译型语言,如Visual Basic,它属于半编译型语言,并不是真正的编译型语言。它首先被编译成P-语言,并将解释引擎封装在可执行性程序内,当运行程序时,P-代码会被解析成真正的二进制代码。表面上看,Visual Basic 可以编译生成 *.exe文件,而且这个 *.exe文件也可以脱离开发环境,在特定平台上运行,非常像编译型语言。实际上,在这个 *.exe文件中,既有程序的启动代码,也有链接解释程序的代码,而这部分代码负责启动Visual Basic 解释程序,再对Visual Basic 代码进行解释并执行。
Java语言比较特殊,由Java语言编写的程序需要经过编译步骤,但这个编译步骤并不会生成特定平台的机器码,而是生成一种与平台无关的字节码(也就是 *.class文件)。当然,这种字节码不是可执行的,必须使用Java解释器来解释执行。因此可以认为:Java语言既是编译型语言,也是解释型语言。或者说,Java语言不是纯粹的编译型语言,也不是纯粹的解释型语言。
Java程序的执行过程必须经过先编译、再解释执行这两个步骤,如图所示:
Java语言里负责解释执行字节码文件的是Java虚拟机,即JVM(Java Virtual Machine)。JVM是可以运行Java字节码文件的虚拟计算机。所有平台上的JVM向编译器提供相同的编程接口,而编译器只需要面向JVM,生成JVM能理解的代码,然后由JVM来解释执行。在一些JVM的实现中,还会将JVM代码转换成特定的机器码执行,从而提高执行效率。
当使用Java编译器编译Java程序时,生成的是与平台无关的字节码,这些字节码不面向任何具体的平台,只面向JVM。不同平台上的JVM都是不同的,但它们都提供了相同的接口。JVM是Java程序跨平台的关键部分,只要为不同的平台实现了相应的虚拟机,编译后的Java字节码就可以在该平台上运行。
JVM是一个抽象的计算机,和实际的计算机一样。它具有指令集,并使用不同的存储区域。它负责执行指令,还要管理数据、内存和寄存器。
Oracle公司制定的Java虚拟机规范在技术上规定了JVM的统一标准,具体定义了JVM的如下细节:
- 指令集
- 寄存器
- 类文件格式
- 栈
- 垃圾回收堆
- 存储区
有待更新……
参考资料:
- 《疯狂Java讲义》