目录
虚拟机在运行java代码之前,我们需要对代码进行一系列转换。以标准JDK的hotspot虚拟机为例,执行java代码首先需要将它编译成的class文件加载到java虚拟机中,加载后的java类会被存放于方法区中。实际运行时,虚拟机会先执行方法区内的代码。JVM会将栈细分为面向java方法的java方法栈,面向java本地方法native栈,以及存放各个线程执行位置的PC寄存器。
JVM会将运行时的内存区域划分为五个部分,分别是方法区,堆,PC寄存器,java方法栈和本地方法栈。
每当调用一个java方法,JVM都会在当前线程的java方法栈中生成一个栈帧,用以存放局部变量以及字节码的操作数,这个栈帧的大小是提前计算好的,而且JVM不要求栈帧在内存空间里连续分布。当退出当前执行的方法时,不管正常返回还是异常返回,JVM都会弹出当前线程的当前栈帧并舍弃。
从硬件视角来看,java字节码是无法直接执行的,因此JVM需要将字节码翻译成机器码。在hotSpot里,翻译方式有两种:第一种是解释执行,即逐条将字节码翻译成机器码并执行;第二种是即时编译(JIT),就是将一个方法中包含的所有字节码一次性编译成字节码再执行。
解释执行的优势在于无须等待编译。
即时编译的优势在于执行速度更快,即时编译拥有程序的运行时信息,并且能根据这个信息作出相应的优化。即时编译建立在程序符合二八定律的假设上,也就是百分之二十的代码占据了百分之八十的计算资源。
hotspot默认采用混合模式,综合了解释执行和即时编译的优点,他会先解释执行字节码,而后将反复执行的热点代码,以方法为单位进行即时编译,翻译成机器码后直接运行在底层硬件上。对于占据大部分的不常用的代码,就没必要耗时将其编译成机器码,而是采用解释执行的方式运行。
java语言的类型分为两大类:基本类型和引用类型。java基本类型时由JVM预先定义好的。至于引用类型,java将其细分为四种类型:类,接口,数组类和泛型参数。由于泛型参数会在编译过程中被擦除,JVM实际上只有类,接口和数组类,数组类是JVM直接生成的,其他两种则有对应的字节流,例如JAVA编译器生成的class文件。
加载:
指的是查找字节流,并以此创建类的过程。对于数组类,他没有对应的字节流,而是由JVM直接生成的,而对于类来说,JVM就需要按照类加载器来完成字节流的加载。首先最上层的启动类加载器,接着其他的类加载器都是classloader的子类,有对应的java对象。
这些类加载器需要先由启动类加载器加载到JVM中才能执行类的加载。另外还有扩展类加载器和应用类加载器,扩展类加载器的父类是启动类加载器,负责加载相对次要但是通用的类,比如存放在JRE下的lib/ext下的jar包类。应用类加载器的父类是扩展类加载器,他负责加载应用程序路径下的类。
类的唯一性就是类加载器实例以及类的全名确定的,即便是统一传字节流,经由不同的类加载器加载也会得到两个不同的类。可以用这种方式来运行一个类的不同版本。
链接:
指的是将创建成的类合并至JVM中,使之能够执行。它可以分为验证,准备,解析三个阶段。
验证的目的是确保加载的类能够满足JVM的约束条件。
准备阶段是为被加载的类的静态字段分配内存。类并不知道自身方法和字段的地址,每当需要引用这些成员时,java编译器会生成一个符号引用,运行阶段会被定为到具体目标上。
解析阶段的目的是将符号引用解析成为实际引用。
初始化:
java代码中,如果要初始化一个静态字段,可以在声明时直接赋值,也可以在静态代码块中赋值。如果直接赋值的静态字段被final修饰,并且类型是基本类型或者字符串,那么该字段会被java编译器标记为常量值。初始化直接由JVM完成。其他的赋值操作,以及所有静态代码块的代码,都会被java编译器放到统一方法中,并命名CL INIT。
初始化时类加载的最后一步,主要是为标记为常量值的字段赋值和运行CL INIT方法。JVM会通过加锁的方式来确保CL INIT仅被执行过一次。
类的初始化扫描情况下会被触发:
1 虚拟机启动时,初始化用户指定的主类。
2 初始化new指令的目标类
3 当遇到访问静态方法或者静态属性的指令时,初始化静态方法或者静态字段所在的类。
4 子类的初始化会触发父类的初始化。
5 一个接口定义了default方法,那么直接实现或者间接实现该接口的类的初始化,会触发该接口的初始化。
6 使用反射的API对某个类进行反射调用。
类的初始化过程是线程安全的,并且只被执行一次,因此确保多线程环境下只有一个实例。