虚拟机类加载机制
概述
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换、解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。
类加载的时机
-
类从被加载到虚拟机内存中开始,到卸载为止,它的整个生命周期包括:
- 加载(Loading)
- 验证(Verification)
- 准备(Preparation)
- 解析(Resolution)
- 初始化(Initialization)
- 使用(Using)
- 卸载(Unloading)
发生顺序如下:
解析阶段的顺序有可能不同- 它在某些情况下可以在初始化阶段之后再开始,这是为了支持Java语言的运行时绑定(也称动态绑定或者晚期绑定)
-
(类)加载的时机:
- 使用
new
关键字实例化对象、读取或设置一个类的静态字段(被final修饰,已在编译器把结果放入常量池的静态字段除外),以及调用一个类的静态方法的时候。 - 使用
java.lang.reflect
包的方法对类进行反射调用的时候,如果类没有初始化,则需要先触发其初始化。 - 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则先要触发其父类的初始化。
- 当虚拟机启动时,用户需要制定一个要执行的主类(包含main方法的那个类),虚拟机会先初始化这个主类。
- 当使用JDK 1.7的动态语言支持时,如果一个java.lang.ubvoke.MethodHandle实例最后解析的结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有进行过初始化,则需要先触发其初始化。
除了上面这几种方式,其余所有的引用类的方法都不会触发初始化,称为被动引用。
- 被动引用的列子
- 通过子类引用父类的静态字段,不会导致子类的初始化
public class SuperClass { static{ System.out.println("SuperClass init!"); } public static int value = 123; } class SubClass extends SuperClass{ static { System.out.println("SubClass init!"); } } class NotInitialization{ public static void main(String[] args) { System.out.println(SubClass.value); } } /* 输出: SuperClass init! */
- 通过数组来定义引用类,不会触发此类的初始化
class NotInitialization{ public static void main(String[] args) { System.out.println(SubClass.value); } } /* 不会初始化SuperClass 但却出发了一个由虚拟机自动生成的、直接继承于java.lang.Object的子类 */
- 常量在编译阶段会存入调用类的常量池中,本质上并没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化。
class ConstClass{ static { System.out.println("ConstClass init!"); } public static final int VALUE = 123; } class NotInitialization{ public static void main(String[] args) { System.out.println(ConstClass.VALUE); } } /* 并不会初始化ConstClass类 */
- 通过子类引用父类的静态字段,不会导致子类的初始化
- 使用
-
(接口)的加载时机:
- 接口与类的区别仅在上述类的加载中的第三条。
当一个接口在初始化时,并不要求其父类全部都完成了初始化,只有在真正使用到父接口的时候(如引用接口中定义的常量)才会有初始化。
- 接口与类的区别仅在上述类的加载中的第三条。
类加载的过程
-
加载(类加载中的加载)
- 加载阶段虚拟机需要完成的三件事情
- 通过一个类的全限定类名来获取定义此类的二进制字节流
- 将这个字节流所代表的的静态存储结构转化为方法区运行时数据结构。
- 在内存中生成一个代表这个类的
java.lang.Class
对象,作为方法区这个类的各种数据结的访问入口。
- 虚拟机规范对第一点(读取二进制字节流)并不具体,所以出现了许多种加载器:
- 从zip包中读取,成为日后的war,ear,war格式的基础
- 从网络中获取,典型应用为Applet
- 运行时产生,代表为动态代理技术
- 由其他文件生成,代表为JSP技术
- 从数据库读取,很少见
- ·····
- 加载阶段虚拟机需要完成的三件事情
-
验证
验证是链接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
验证阶段大致会完成下面的4个阶段的检验动作:
-
文件格式验证
第一阶段要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。
-
元数据验证
第二阶段是对字节码描述的信息进行语义分析,以保证其描述信息符合Java语言规范的要求。
-
字节码验证
第三阶段是整个验证过程中最复杂的一个阶段,主要目的是通过数据流和控制流分析,确定语义是合法的、符合逻辑的。
为了避免在字节码验证期间消耗太多的时间,在JDK1.6之后的Javac编译器和虚拟机中进行了一项优化,给方法体的Code属性的属性表中增加了一项名为“StackMapTable”的属性,在验证字节码期间,就不需要根据程序推导这些状态的合法性,只需检查StackMapTable属性中的记录是否合法即可。
-
符号引用验证
最后一个阶段的校验发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在连接的第三个阶段——解析阶段中发生。
对于虚拟机的类加载机制来说,验证阶段是一个非常重要的、但不一定是必要(因为对程序运行期没有影响)的阶段。
-
-
准备
准备阶段是正式为类变量分配内存并设置变量初始值(零值)的阶段,这些变量所使用的的内存都将在方法去进行分配。
-
解析
解析阶段是虚拟机将常量池的符号引用替换为直接引用的过程。
-
符号引用
符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。
- 符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。
-
直接引用
直接引用可以使直接指向目标的指针、相对便宜量或是一个能简介定位到目标的句柄。
- 直接引用是和虚拟机实现的内存布局相关的。
-
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符。
-
-
初始化
初始化阶段,才真正开始执行类中定义的Java程序代码(或者说字节码)
初始化阶段是执行类构造器()方法的过程。
- <clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{}块)中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序所决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块可以赋值,但是不能访问,
- <clinit>()方法与类的构造函数(或者说实例构造器<init>()方法)不同,它不需要显式地调用父类构造器,虚拟机会保证在子类的<clinit>()方法执行之前,父类的<clinit>()方法已经执行完毕。
- 由于父类的<clinit>()方法先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作
- <clinit>()方法对于类或接口来说并不是必需的,如果一个类中没有静态语句块,也没有对变量的赋值操作,那么编译器可以不为这个类生成<clinit>()方法。
- 接口中不能使用静态语句块,但仍然有变量初始化的赋值操作,因此接口与类一样都会生成<clinit>()方法。但接口与类不同的是,执行接口的<clinit>()方法不需要先执行父接口的<clinit>()方法。只有当父接口中定义的变量使用时,父接口才会初始化。另外,接口的实现类在初始化时也一样不会执行接口的<clinit>()方法。
- 虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>()方法,其他线程都需要阻塞等待,直到活动线程执行<clinit>()方法完毕。如果在一个类的<clinit>()方法中有耗时很长的操作,就可能造成多个进程阻塞[2],在实际应用中这种阻塞往往是很隐蔽的。
类加载器
虚拟机设计团队把类加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部去实现,以便让应用程序自己决定如何去获取所需要的类。实现这个动作的代码模块称为“类加载器”。
- 类与类加载器
比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则,即使这两个类来源于同一个Class文件,被同一个虚拟机加载,只要加载它们的类加载器不同,那这两个类就必定不相等。 - 双亲委派模型
- 双亲委派模型工作过程:
如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去加载。
- 双亲委派模型工作过程: