Java虚拟机类加载机制
代码编译的结果从本地机器码转变为字节码,是存储格式发展的一小步,却是编程语言发展的一大步。
1概述
虚拟机把描述类的数据从class文件加载到内存,并对数据进行校验、 转换解析和初始化, 最终形成可以被虚拟机直接使用的Java类型, 这就是虚拟机的类加载机制。
Java 类加载器基于三个机制: 委托性、 可见性和单一性。
1.委托机制是指双亲委派模型。 当一个类加载和初始化的时候, 类仅在有需要加载的时候被加载。 假设你有一个应用需要的类叫作 Abc.class, 首先加载这个类的请求由 Application 类加载器委托给它的父类加载器 Extension 类加载器,然后再委托给 Bootstrap 类加载器。Bootstrap 类加载器 会先看看rt.jar 中有没有这个类, 因为并没有这个类, 所以这个请求又回到 Extension 类加载器, 它会查看 jre/lib/ext 目录下有没有这个类, 如果这个类被 Extension 类加载器找到了,那么它将被加载, 而 Application 类加载器不会加载这个类; 而如果这个类没有被 Extension 类加载器找到,那么再由 Application 类加载器从 classpath 中寻找,如果没找到, 就会抛出异常。
双亲委托机制的优点就是能够提高软件系统的安全性。 因为在此机制下,用户自定义的类加载器不可能加载本应该由父加载器加载的可靠类, 从而防止不可靠的恶意代码代替由父类加载器加载的可靠代码。 如, java.lang.Object 类总是由根类加载器加载的, 其他任何用户自定义的类加载器都不可能加载含有恶意代码的 java.lang.Object 类。
2.可见性原理是子类的加载器可以看见所有的父类加载器加载的类,而父类加载器看不到子类加载器加载的类。
3.单一性原理是指仅加载一个类一次,这是由委托机制确保子类加载器不会再次加载父类加载器加载过的类。
在Java语言里面, 类型的加载、 连接和初始化过程都是在程序运行期间完成的, 这种策略虽然会令类加载时稍微增加一些性能开销, 但是会为Java应用程序提供高度的灵活性, Java里天生可以动态扩展的语言特性就是依赖运行期动态加载和动态连接这个特点实现的。 例如, 如果编写一个面向接口的应用程序, 可以等到运行时再指定其实际的实现类。
2类加载的时机
类从被加载到虚拟机内存中开始, 到卸载出内存为止, 它的整个生命周期包括: 加载(Loading)、 验证(Verification) 、 准备(Preparation) 、 解析(Resolution) 、 初始化(Initialization) 、 使用(Using) 和卸载(Unloading) 7个阶段。 其中验证、 准备、 解析3个部分统称为连接。
加载、 验证、 准备、 初始化和卸载这5个阶段的顺序是确定的, 类的加载过程必须按照这种顺序按部就班地开始, 而解析阶段则不一定: 它在某些情况下可以在初始化阶段之后再开始, 这是为了支持Java语言的运行时绑定(也称为动态绑定或晚期绑定) 。
注意1: 什么情况下虚拟机需要开始加载一个类呢?虚拟机规范中并没有对此进行强制约束,这点可以交给虚拟机的具体实现来自由把握
注意2: 虚拟机规范则是严格规定了有且只有5种情况必须立即对类进行“初始化” (而加载、 验证、 准备自然需要在此之前开始):
- 遇到new、 getstatic、 putstatic或invokestatic这4条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。 生成这4条指令的最常见的Java代码场景是: 使用new关键字实例化对象的时候、读取或设置一个类的静态字段(被final修饰、 已在编译期把结果放入常量池的静态字段除外) 的时候, 以及调用一个类的静态方法的时候。
- 使用java.lang.reflect包的方法对类进行反射调用的时候, 如果类没有进行过初始化, 则需要先触发其初始化
- 当初始化一个类的时候, 如果发现其父类还没有进行过初始化, 则需要先触发其父类的初始化。接口只要在真正使用到时候再初始化。
- 当虚拟机启动时, 用户需要指定一个要执行的主类(包含main() 方法的那个类) , 虚拟机会先初始化这个主类。
- 当使用JDK 1.7的动态语言支持时, 如果一个java.lang.invoke.MethodHandle 实例最后的解析结果REF_getStatic、 REF_putStatic、 REF_invokeStatic的方法句柄, 并且这个方法句柄所对应的类没有进行过初始化, 则需要先触发其初始化
对于静态字段,只有直接定义这个字段的类才会被初始化
通过数组定义来应用类,不会触发类的初始化
常量在编译阶段会存入调用累的常量池中,不会触发定义常量类的初始化
3类加载的过程
3.1加载
在加载阶段, 虚拟机需要完成以下3件事情:
1通过一个类的全限定名来获取定义此类的二进制字节流。
2将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。将编译阶段产生的常量池转化为运行时常量池。
3在内存中生成一个代表这个类的java.lang.Class对象, 作为方法区这个类的各种数据的访问入口。
加载阶段完成后, 虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中, 方法区中的数据存储格式由虚拟机实现自行定义, 虚拟机规范未规定此区域的具体数据结构。然后在内存中实例化一个java.lang.Class类的对象,class类对象比较特殊,虽然是对象但是存放在方法区里面。
3.2验证
验证是连接阶段的第一步, 这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求, 并且不会危害虚拟机自身的安全。主要有文件格式验证,元数据验证,字节码验证,符号引用验证。
文件格式验证:验证字节流是否符合Class文件格式的规范,并且被当前版本虚拟机理解,如常量池是否有不被支持的常量类型,指向常量的索引是否有指向不存在的常量或不符合类型的常量。
元数据验证:对字节码进行语义分析,保证描述信息符合Java语言规范。比如这个类是否继承不允许被继承的类等
字节码验证:对数据流和控制流分析,确定程序的语义是合法的,符合逻辑的。比如定义了 int 类型数据结构,使用时候却按照long 加载。
符号引用验证:确保解析动作能够正常执行【这个解析阶段是将符号引用转化为直接引用】
3.3准备
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段, 这些变量所使用的内存都将在方法区中进行分配。 这个阶段中有两个容易产生混淆的概念需要强调一下, 首先, 这时候进行内存分配的仅包括类变量(被static修饰的变量) , 而不包括实例变量, 实例变量将会在对象实例化时随着对象一起分配在Java堆中。 其次, 这里所说的初始值“通常情况” 下是数据类型的零值。
3.4解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。因为在编译时并不知道引用类的实际内存.地址,因此只能用符号引用代替。直接引用就是实际的内存地址。(参考博文)
以字段解析为例:
首先,将会对字段表内class_index 项中索引的CONSTANT_Class_info 符号引用进行解析,也就是字段所属的类或则接口的符号引用。如果解析这个类或则接口符号过程中出现异常则解析失败。
接着
1)如果类C包含了字段描述符都与目标相匹配的字段,则返回这个自动的直接引用。
2)否则,如果C实现接口,则按照继承关系从下往上递归搜索各个接口和他的父接口,如果接口中包含了字段描述符都与目标相匹配的字段,返回直接引用。
3)否则,则按照继承关系从下往上递归搜索其父类,如果在父类中包含了字段描述符都与目标相匹配的字段,返回直接引用。
4)否则,解析失败。
3.5初始化
类初始化阶段是类加载过程的最后一步, 前面的类加载过程中, 除了在加载阶段用户应用程序可以通过自定义类加载器参与之外, 其余动作完全由虚拟机主导和控制。 到了初始化阶段, 才真正开始执行类中定义的Java程序代码(或者说是字节码) 。
在准备阶段, 变量已经赋过一次系统要求的初始值, 而在初始化阶段, 则根据程序员通过程序制定的主观计划去初始化类变量和其他资源, 或者可以从另外一个角度来表达: 初始化阶段是执行类构造器() 方法的过程。
4、类加载器
虚拟机设计团队把类加载阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流” 这个动作放到Java虚拟机外部去实现, 以便让应用程序自己决定如何去获取所需要的类。 实现这个动作的代码模块称为类加载器。
4 .1类与类加载器
类加载器虽然只用于实现类的加载动作, 但它在Java程序中起到的作用却远远不限于类加载阶段。对于任意一个类, 都需要由加载它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性, 每一个类加载器, 都拥有一个独立的类名称空间。 这句话可以表达得更通俗一些: 比较两个类是否“相等” , 只有在这两个类是由同一个类加载器加载的前提下才有意义, 否则, 即使这两个类来源于同一个Class文件, 被同一个虚拟机加载, 只要加载它们的类加载器不同, 那这两个类就必定不相等。
4.2双亲委派模型
从Java虚拟机的角度来讲, 只存在两种不同的类加载器: 一种是启动类加载器(Bootstrap ClassLoader) ,这个类加载器使用C++语言实现, 是虚拟机自身的一部分; 另一种就是所有其他的类加载器, 这些类加载器都由Java语言实现, 独立于虚拟机外部, 并且全都继承自抽象类java.lang.ClassLoader。
从开发人员的角度看,类加载器还可以划分成以下三种系统提供的类加载器,用于加载不同类型.class文件。
- Bootstrap classes: 是一些在rt.jar和一些其他jar包的class文件.
- Extension classes:在JAVA_HOME/jre/lib/ext中jar包的class文件.
- User Classes: 这个就是我们自己编译生成的class文件或者引入的第三方的class文件. 用-classpath(缩写-cp)来表示他们的路径.
- 启动器加载器,这个类将器负责将存放在<JAVA_HOME>\lib目录中的,或者被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的(仅按照文件名识别, 如rt.jar,名字不符合的类库即使放在lib目录中也不会被加载) 类库加载到虚拟机内存中。
- 扩展类加载器 这个加载器由sun.misc.Launcher $ExtClassLoader实现, 它负责加载<JAVA_HOME>**\lib\ext目录中的**, 或者被java.ext.dirs系统变量所指定的路径中的所有类库, 开发者可以直接使用扩展类加载器。
- 应用程序加载器(Applicaton/System ClassLoader) 这个类加载器由sun.misc.Launcher $App-ClassLoader实现。 由于这个类加载器是ClassLoader中的getSystemClassLoader()方法的返回值, 所以一般也称它为系统类加载器。 它负责加载用户类路径(ClassPath) 上所指定的类库, 开发者可以直接使用这个类加载器, 如果应用程序中没有自定义过自己的类加载器, 一般情况下这个就是程序中默认的类加载器。
应用程序由这三种类加载器互相配合进行加载,如果有必要,还可以加入自己定义的类加载器。
上图展示的类加载器之间的层次关系,称为类加载器的双亲委派模型,双亲委派模型要求除了顶层的启动类加载器外, 其余的类加载器都应当有自己的父类加载器。 这里类加载器之间的父子关系一般不会以继承(Inheritance) 的关系来实现, 而是都使用组合(Composition) 关系来复用。
双亲委派模型的工作过程是: 如果一个类加载器收到了类加载的请求, 它首先不会自己去尝试加载这个类, 而是把这个请求委派给父类加载器去完成, 每一个层次的类加载器都是如此, 因此所有的加载请求最终都应该传送到顶层的启动类加载器中, 只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时, 子加载器才会尝试自己去加载。如父类为空,则默认启动类加载器作为父类加载器。