java类加载过程一共分为5个步骤:加载、验证、准备、解析、初始化。jvm堆类加载的每一步骤都做了哪些事呢?以下详细的做一下分析:
1 加载。
java类加载阶段,虚拟机需要做以下三件事:
1>通过一个类的全限定名来获取定义此类的二进制字节流。
2>将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
3>在java堆中生成一个代表这个类的java.lang.Class对象,作为方法区这些数据的访问入口。
加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需要的格式存储在方法区中。
2 验证。
验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
Java语言本身是相对安全的语言(依然是相对于C/C++来说),使用纯粹的Java代码无法做到诸如访问数组边界以外的数据、将一个对象转型为它并未实现的类型、跳转到不存在的代码行之类的事情,如果这样做了,编译器将拒绝编译。但前面已经说过, Class文件并不一定要求用Java源码编译而来,可以使用任何途径,包括用十六进制编辑器直接编写来产生Class文件。在字节码的语言层面上,上述Java代码无法做到的事情都是可以实现的,至少语义上是可以表达出来的。虚拟机如果不检査输入的字节流, 对其完全信任的话,很可能会因为载入了有害的字节流而导致系统崩溃.所以验证是虚拟机对自我保护的一项重要工作。
jvm大致上都会完成下面四个阶段的检验过程:文件格式验证、元数据验证、字节码验证和符号引用验证。
1>文件格式验证,确保文件格式符合Class文件格式的规范。
第一阶段要验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理.这一阶段可能包括下面这些验证点:
□是否以魔数OxCAFEBABE开头。
□主、次版本号是否在当前虚拟机处理范围之内。
□常量池的常量中是否有不被支持的常量类型(检查常量tag标志)。
□指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
□ CONSTANT_UtfB_infb型的常量中是否有不符合UTF8编码的数据。
□ Class文件中各个部分及文件本身是否有被删除的或附加的其他信息。
实际上第一阶段的验证点还远不止这些,上面这些只是从HotSpot虚拟机源码中摘抄的一小部分,该验证阶段的主要目的是保证输人的字节流能正确地解析并存储于方法区之内,格式上符合描述一个Java类型信息的要求。这阶段的验证是基于字节流进行 的,经过了这个阶段的验证之后,字节流才会进入内存的方法区中进行存储,所以后面的三个验证阶段全部是基于方法区的存储结构进行的。
2>元数据验证
第二阶段是对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求,这个阶段可能包括的验证点如下:
□这个类是否有父类(除了 java.lang.Object之外,所有的类都应当有父类)。
□这个类的父类是否继承了不允许被继承的类(被final修饰的类)。
□如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法。
□类中的字段、方法是否与父类产生了矛盾(例如覆盖了父类的final字段,或者出现不符合规則的方法重载,例如方法参数都一致,但返回值类型却不同等)。
第二阶段的主要目的是对类的元数据信息进行语义校验,保证不存在不符合Java语 言规范的元数据信。
3>字节码验证
第三阶段是整个验证过程中最复杂的一个阶段,主要工作是进行数据流和控制流分析,在第二阶段对元数据信息中的数据类型做完校验后,这阶段将对类的方法体进行校验分析。这阶段的任务是保证被校验类的方法在运行时不会做出危害虚拟机安全的行 为,例如:
□保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作,例如不会出现类似这样的情况:在操作栈中放置了一个int类型的数据,使用时却按long类型来加载入本地变量表中。
□保证跳转指令不会眺转到方法体以外的字节码指令上。
□保证方法体中的类型转换是有效的,例如可以把一个子类对象赋值给父类数据类型,这是安全的,但是把父类对象赋值给子类数据类型,甚至把对象赋值给与它毫无继承关系、完全不相干的一个数据类型,则是危险和不合法的。
如果一个类方法体的字节码没有通过字节码验证,那肯定是有问题的。但如果一个方法体通过了字节码验证,也不能说明其一定就是安全的。即使字节码验证之中进行了大量的检查,也不能保证这一点。
4>符号引用验证
最后一个阶段的校验发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在连接的第三个阶段 一 解析阶段中发生。符号引用验证可以看做是对类自身以外 (常量池中的各种符号引用)的信息进行匹配性的校验,通常需要校验以下内容:
□符号引用中通过字符串描述的全限定名是否能找到对应的类。
□在指定类中是否存在符合方法的字段描述符及简单名称所描述的方法和字段。
□符号引用中的类、字段和方法的访问性(private、protected、public、default〉是否可被当前类访问。
符号引用验证的目的是确保解析动作能正常执行,如果无法通过符号引用验证,将会抛出一个java.lang. IncompatibleClassChangeError异常的子类,如java.lang. lllegalAcccssError、java.Iang.NoSuchFieldError、java.Iang.NoSuchMethodError 等。
3 准备
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中进行分配。这个阶段中有两个容易产生混淆的概念需要强调一下,首先是这时候进行内存分配的仅包括类变量(被static修饰的变量),而不包括实例变量,实例变量将 会在对象实例化时随着对象一起分配在Java堆中。其次是这里所说的初始值“通常情况”下是数据类型的零值,假设一个类变量的定义为:
public static int value = 123;
那么变量value在准备阶段过后的初始值为0而不是123,因为这时候尚未开始执行任何java方法,而把value赋值为123的putstatic指令是程序被编译后,存放于类构造器<clinit>()方法之中,所以把value赋值为123的动作将在初始化阶段才会被执行。
上面提到,在“通常情况”下初始值是零值,那相对的会有一些“特殊情况如果类字段的字段属性表中存在ConstantValue 属性,那在准备阶段变最value就会被初始化为ConstantValue属性所指定的值,假设上面类变量 value的定义变为:
public static final int value = 123;
编译时javac将会为value生成ConstantValue属性,在准备阶段虚拟机就会根据 ConstantValue 的设置将 value 赋值为123。
4 解析
解析阶段是虚拟机将常量池的符号引用替换为直接引用的过程。
解析动做主要针对类或接口、字段、类方法、接口方法四类符号引用进行,分别对应于常量池的CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info及CONSTANT_InterfaceMethodRef_info四种类型常量。
5 初始化
类初始化阶段是类加载过程的最后一步,前面的类加载过程中,除了在加载阶段用户应用程序可以通过自定义类加栽器参与之外,其余动作完全由虚拟机主导和控制。到了初始化阶段,才真正开始执行类中定义的Java程序代码(或者说字节码)。
在准备阶段。变量已经赋值过一次系统要求的初始值,而在初始化阶段,则是根据程 员通过程序制定的主观计划去初始化类变置和其他资源,或者可以从另外一个角度来表达:初始化阶段是执行类构造器<clinit>()方法的过程。