虚拟机把描述类的数据从class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的java类型。
1.类加载时机
类从呗加载到内存中开始,到卸载出内存为止,经历7个阶段,为1个生命周期。
加载、验证、准备、初始化、卸载这五个阶段的顺序是确定的,其余常是互相交叉进行。
对加载阶段,虚拟机规范中并没有进行强制约束,这点可以交给虚拟机的具体实现来自由把握。但对于初始化阶段,虚拟机规范则严格规定了有且只有四种情况必须立即对类进行初始化(加载、验证、准备自然在此之前开始)。
对类的主动引用
- 遇到new、getstatic、putstatic或invokedtatic这4条字节码指令时,如果类没有进行初始化,则需要先触发其初始化。生成这4条指令最常见的java代码情景是:
a.使用new关键字实例化对象的时候
b.读取或设置一个类的静态字段的时候(被final修饰过的会在编译期把结果放入常量池中)
c.调用一个类的静态方法的时候 - 使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则先触发其初始化。
- 当初始化一个类的时候,如果发现父类未初始化,则需要先触发其父类的初始化,注意接口是只有真正使用到父接口的时候才会初始化。
- 当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),那么虚拟机会先初始化这个主类。
- 遇到new、getstatic、putstatic或invokedtatic这4条字节码指令时,如果类没有进行初始化,则需要先触发其初始化。生成这4条指令最常见的java代码情景是:
对类的被动引用
- 通过子类引用父类的静态字段,不会导致子类初始化
- 通过数组定义引用类,不会触发此类的初始化
- 常量在编译阶段会存入调用类的常量池中,本质上没有直接引用到定义常量的类,因此不会触发定义常量的类的初始化。
2.类加载过程
2.1 加载
此阶段虚拟机完成以下三件事情:
- 通过一个类的全限定名来获取定义此类的二进制字节流
- 将这个字节流所代表的静态存储结构转为方法区的运行数据结构
- 在java堆中生成一个代表这个类的java.lang.Class对象,作为方法区这些数据的访问入口
个人理解:主要就是根据名找到对应的class文件的过程,再对static进行处理
2.2 验证
这一阶段目的是为了确保class文件的字节流中包含的信息复合当前虚拟机的要求,并且不会危害虚拟机自身的安全。大体完成四个阶段的检验:
1. 文件格式验证
第一阶段验证字节流是否复合class文件格式的规范,并且能被当前版本的虚拟机处理,例如魔数、主次版本等很多信息。
该阶段的主要目的是保证输入的字节流能正确地解析并存储于方法区内,格式上符合一个java类型信息的要求。
这个阶段的验证是基于字节流进行的,经过了这个阶段的验证之后,字节流才会进入内存的方法区中进行存储,所以后面的三个阶段全部是基于方法区的存储结构进行的。
2. 元数据验证
第二阶段是对字节码描述的信息进行语义分析,以保证其描述的信息复合Java语言规范的要求。验证点如类是否有父类,是否继承了不被允许继承的类等等。
目的是对类的元数据进行校验,保证不存在不符合Java语言规范的元数据信息。
3. 字节码验证
第三阶段是整个验证过程中最复杂的一个阶段,主要工作是进行数据流和控制流分析。
在第二阶段对元数据信息中的数据类型做完校验后,这阶段将对类的方法体进行校验分析。
这阶段的任务是保证被校验类的方法在运行时不会做出危害虚拟机安全的行为。
4. 符号引用验证
最后一个阶段的校验发生在虚拟机将符号转为直接引用的时候,这个动作将在连接的第三个阶段——解析阶段中发生。
符号引用验证可以看作是对类自身以外(常量池中的各种符号引用)的信息进行匹配性校验,内容如根据名能否找到类、方法字段等。
这阶段目的是确保解析动作的正常执行,如果无法通过符号验证,将会抛出一个java.lang.IncompatibleClassChangeError异常的子类,如java.lang.IllegalAccessError、java.lang.NoSuchFieldError、java.lang.NoSuchMethdError等。
个人理解:这个阶段就是对找到的class文件进行一些基础语法校验,大多数校验的问题在编译期都会有提示。
2.3 准备
准备阶段是正式为变量分配内存并设置类变量初始值的阶段。这些内存都将在方法区中进行分配。
注意,这时候进行内存分配的变量仅包括类变量(static),而不包括实例变量。
public static int value = 123;
通常,以上代码在此阶段初始值为0,123是初始化阶段执行赋值的。而
public static final int value = 123;
增加final修饰,会为value生成ConstantValue属性,值为123。
个人理解:这个阶段就是对通过验证的class类进行类相关信息(static修饰的部分)的内存分配,
2.4 解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
- 符号引用(Symbolic References)
以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。 - 直接引用(Direct References)
直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。直接引用是与虚拟机实现的内存布局相关的,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经存在内存地址中。
解析的动作主要针对类或接口、字段、类方法、接口方法四类符号进行引用,分别对应于常量池的CONSTANT_class_info、CONSTANT_Fieldref_info、CONSTANT_Method_info及CONSTANT_InterfaceMethodref_info。
个人理解:我理解的是class文件给出的试试代码的逻辑结构信息,而在这一阶段是将这些逻辑信息直接对应于内存中的具体地址信息。
2.5 初始化
真正开始执行类中定义的Java程序代码(或者说是字节码)。从另一个角度来说初始化阶段是执行类构造器()方法的过程。
3.类加载器
虚拟机设计团队把类加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部去实现,以便让应用程序自己决定如何去获取所需要的类。实现这个动作的代码模块被称为“类加载器”。
注意:同一个class,使用自定义加载器加载,其实例不是虚拟机加载的类对象。instanceof 返回false。
值得关注的是在类加载时遵循双亲委派模型,即常说的父委托机制。在加载类的时候,会向上询问父类加载器进行加载,只要有父类就一直向上询问,当最高父类不能加载时会向下调用类加载器进行类的加载。
所以,当你写一个String类时会发现自己写的无法被正确调用,因为加载的都是也许这就是java防止篡改类库的一种方式吧。