JVM架构模型图:
一、各种语言的发展
机器码
用二进制编码方式表示的指令(010101...等等),叫做机器指令码,也叫硬编码。最初人们采用它编写程序,这就是机器语言。
- 机器码虽能被计算机理解和接受,但不易理解和记忆,编码难度也较大;
- 机器码的程序,CPU能直接读取运行,因此和其他语言编的程序相比,执行速度最快;
- 机器指令与CPU硬件紧密相关,所以不同种类的CPU所对应的机器指令也就不同。
指令
- 由于机器码是由0和1组成的二进制序列,可读性实在太差,于是发明了指令;
- 指令就是把机器码中特定的0和1序列,简化成对应的指令(一般为英文简写,如mov,inc等),可读性稍好;
- 但不同的硬件平台,执行同一个操作,对应的机器码可能不同;不同的硬件平台的同一种指令,对应的机器码也可能不同。
指令集
不同的硬件平台,各自支持的指令是有差别的。因此每个平台所支持的指令,称之为对应平台的指令集。
- x86指令集,对应的是x86架构的平台
- ARM指令集,对应的是ARM架构的平台
汇编语言(硬件级别的语言,不能跨平台)
- 由于指令的可读性还是太差,于是又发明了汇编语言;
- 汇编语言中,用助记符(Mnemonics)代替机器指令的操作码,用地址符号(Symbol)或标号(Label)代替指令或操作数的地址;
- 不同的硬件平台,汇编语言对应着不同的机器语言指令集,通过汇编过程转换成机器指令。
- 由于计算机只认识指令码,所以用汇编语言编写的程序还必须翻译成机器指令码,计算机才能识别和执行。
高级语言
- 为了让用户编程更容易些,后来就出现了各种高级计算机语言,高级语言比机器语言、汇编语言更接近人的语言;
- 当计算机执行高级语言编写的程序时,仍然需要把程序解释和编译成机器的指令码。完成这个过程的程序就叫做解释程序或编译程序。
二、JVM执行引擎
JVM主要负责装载字节码到其内部,但字节码并不能够运行在操作系统之上,因为字节码指令并非机器码,且只能JVM识别,所以为了让Java程序运行起来,JVM中的执行引擎扮演将高级语言翻译为机器语言的角色,以及对字节码优化和执行GC清理垃圾。
JVM执行引擎包含:解释器(2种)、JIT即时编译器、GC。
- 执行引擎执行哪条字节码指令完全依赖于PC寄存器,每当执行完一项指令操作后,PC寄存器就会更新下一条需要被执行的指令地址。
- 执行方法过程中,有可能会通过存储在局部变量表(栈)中的对象引用准确定位到存储在Java堆区中的对象实例信息;
- 通过对象头(堆)中的元数据指针,定位到目标对象的类型信息(方法区);
1、解释器(interpreter)
JVM设计初期,仅仅为满足Java程序实现跨平台特性,因此避免采用静态编译的方式直接生成本地机器指令,从而实现了在运行时采用逐行解释字节码到机器码执行程序的方案。
JVM发展史中,共有两套解释执行器:
- 古老的字节码解释器:在执行时通过纯软件代码翻译字节码的执行,效率非常低下。
- 现在普遍使用的模板解释器:将每一条字节码和一个模板函数相关联,模板函数中直接产生这条字节码执行时的机器码,提高了解释器的性能。
在HotSpot VM中,解释器主要由Interpreter模块和Code模块构成。
- Interpreter模块:实现了解释器的核心功能;
- Code模块:用于管理HotSpot VM在运行时生成的本地机器指令;
2、JIT即时编译器 (Just In Time Compiler)
由于解释器在设计和实现上非常简单,且相当低效。为了解决这个问题,JVM提供了即时编译技术:即时编译可以将整个函数体编译成为机器码,有效到避免函数体被解释执行,而是重复执行时直