虚拟机类加载机制

概述

虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。

类型的加载、连接和初始化过程都是在程序运行期间完成的,基于这个特点,Java可以扩展动态语言,如Applet、JSP和OSGi等。

类加载的时机

类的生命周期如下图所示:
这里写图片描述
其中,加载、验证、准备、初始化、卸载的顺序是确定的,按这种顺序开始,解析在某些情况下可以在初始化阶段后再开始,这是为了支持运行时绑定。

只是按顺序开始,有些阶段是交叉进行的。

有5种情况必须立即对类进行初始化:

  • 遇到new、getstatic、putstatic、invokestatic四条字节码指令时,如果类没有进行过初始化,需要先触发其初始化,常见的例子是:使用new实例化对象、读取一个类的静态字段(带final的不算)、调用一个类的静态方法;
  • 使用reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,要先触发其初始化;
  • 初始化一个类时,如果其父类还没有进行过初始化,需要先触发父类的初始化;
  • 虚拟机启动时,用户需要制定一个执行的主类,虚拟机会先初始化这个主类;
  • 当java.lang.invoke.MethodHandle实例最后的解析结果是REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且方法句柄对应的类没有初始化,需要先触发其初始化。

只有这五种方式能触发初始化,下面是一个例子:

public class SuperClass {

    static {          //静态初始块
        System.out.println("SuperClass init");
    }

    public static int value = 123;
}
public class SubClass extends SuperClass {

    static {
        System.out.println("SubClass init");
    }

}
public class test1 {
    public static void main(String[] args) {
        System.out.println(SubClass.value);

    }
}

在上述例子中,子类调用了父类的静态域,所以父类被初始化,而子类不会加载,测试结果如下:

SuperClass init
123

创建一个类的数组也不会触发初始化,看下面的代码:

public class test2 {
    public static void main(String[] args) {
        SuperClass[] superClasses = new SuperClass[10];
    }
}

运行之后没有输出,说明没有初始化,需要对单个数组元素进行初始化。

public class ConstClass {
    static {
        System.out.println("ConstClass init");
    }

    public static final int a = 100;
}
public class test3 {
    public static void main(String[] args) {
        System.out.println(ConstClass.a);
    }
}

在上面的代码中,只输出100,说明ConstClass没有初始化,这是因为编译阶段已经将此常量放入test3类里的常量池中,引用ConstClass的常量其实是引用自身常量。

接口初始化时不要求初始化父接口。

类加载的过程

加载

加载阶段,虚拟机要完成三件事情:

  • 通过一个类的全限定名来获取定义此类的二进制字节流;
  • 将这个字节流代表的静态存储结构转化为方法区的运行时数据结构;
  • 在内存中生成一个java.lang.Class对象,作为方法区这个类的各种数据的访问入口。

获取二进制字节流的途径:

  • 从ZIP包中读取,这很常见,并成为JAR、EAR、WAR格式的基础;
  • 从网络中获取,如Applet;
  • 运行时计算生成,这种场景使用的最多的是动态代理技术,在java.lang.Proxy中,用Proxygenerator.generateProxyClass来为特定接口生成形式为“*$Proxy”的代理类的二进制字节流;
  • 由其他文件生成,典型场景是JSP应用,即由JSP文件生成对应的Class类;
  • 从数据库中读取,例如有些中间件服务器可以选择把程序安装到数据库中来完成程序代码在集群间的分发。

可通过重写类加载器的loadClass方法控制字节流的获取方式。

数组类是由虚拟机直接创建的,创建过程遵循以下规则:

  • 如果数组的组件类型是引用类型(对象),就递归加载组件类型,数组将在加载组件类型的类加载器的类名称空验证阶段间上被标识;
  • 如果数组的组件类型不是引用类型(基本类型),虚拟机会把数组标记为引导类加载器关联;
  • 数组类的可见性与他的组件类型的可见性一致,如果组件类型不是引用类型,默认为public。

加载阶段与连接阶段的一部分内容是交叉进行的(如一部分字节码文件格式验证动作),加载阶段尚未完成连接阶段可能已经开始,但这些夹在加载阶段进行的动作,仍然属于连接阶段的内容。

验证

验证是连接的第一步,这一阶段目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。

Java语言是相对安全的语言,Java代码不会放问数组边界以外的数据、将一个对象转型为它未实现的类型、跳转到不存在的代码行之类的事情,如果这样做了,根本无法编译。但Class文件可能是由其它语言编译出来的,虚拟机如果不检查输入的字节流,很可能会因为载入了有害的字节流而导致系统崩溃,所以验证是虚拟机对自身保护的一项重要工作。

验证阶段大致会完成四个阶段的检验动作:文件格式验证、元数据验证、字节码验证、符号引用验证。

文件格式验证

这一阶段要验证字节流是否符合Class文件的格式规范,并且能被当前版本虚拟机处理,包括以下验证点:

  • 是否以魔数0xCAFEBABE开头;
  • 主、次版本号是否在当前虚拟机处理范围之内;
  • 常量池中的常量是否有不被支持的常量类型(检查常量tag标志);
  • 指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量;
  • CONSTANT_Utf8_info型的常量中是否有不符合UTF8编码的数据;
  • Class文件中各个部分及文件本身是否有被删除的或附加的其他信息。

第一阶段的验证点还有很多,只有通过了这个阶段的验证,字节流才会进入内存的方法区中进行存储。

元数据验证

第二阶段是对字节码描述的信息进行语义分析,以确保其描述的信息符合Java语言规范的要求,包括以下验证点:

  • 这个类是否有父类(除了Object超类,其他类都有父类);
  • 这个类的父类是否继承了不允许被继承的类(final修饰的类);
  • 如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法;
  • 类中的字段、方法是否与父类产生矛盾。
字节码验证

第三阶段是验证过程中最复杂的一个阶段,主要目的是通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的,在第二阶段对元数据信息中的数据类型做完校验后,这个阶段将对类的方法体进行校验分析,保证被校验类的方法在运行时不会做出危害虚拟机安全的事件,例如:

  • 保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作;
  • 保证跳转指令不会跳转到方法体以外的字节码指令上;
  • 保证方法体内的类型转换是有效的,例如把子类对象赋值给父类类型。

在Code属性表中有一项“StackMapTable”的属性,描述了方法体中所有的基本块(按照控制流拆分的代码块)开始时本地变量表和操作数栈应有的状态,在字节码验证期间,就不需要根据程序推导这些状态的合法性,只需要检查StackMapTable即可,从而将字节码验证的类型推导转变为类型检查,节省时间。

如果一个类方法体的字节码没有通过字节码验证,那肯定是有问题的,但如果一个方法通过了字节码验证,也不能说明是安全的。

符号引用验证

最后一个阶段的校验发生在虚拟机将符号引用转化为直接引用时候,这个转化动作将在连接的第三阶段——解析阶段中发生。符号引用验证可看做是类对自身以外的信息进行匹配性校验,通常需要校验下列内容:

  • 符号引用中通过字符串描述的全限定名是否能找到对应的类;
  • 在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段;
  • 符号引用中的类、字段、方法的可见性是否可被当前类访问。

验证阶段不是必须的,如果确保自己的代码安全,可用-Xverify:none参数关闭类验证。

准备

准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配,这个时候分配的仅包括类变量(static变量),不包括实例变量,实例变量会在对象实例化时随着对象一起分配在Java堆中。初始值通常情况是数据类型的零值,也就是说,准备阶段之后数据为0而不是它对应的值,赋值的putstatic指令是程序编译后存放在类构造器方法中,在初始化之后才执行。

也有一些特殊情况:如果类字段的字段属性表中存在ConstValue属性,那么在准备阶段变量value初始化为对应的值,而非零值,一般为final static修饰的常量。

解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,符号引用与直接引用关系如下:

  • 符号引用(Symbolic References):符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中,各种虚拟机实现的内存布局可以各不相同,但他们能接受的符号引用必须都是一致的,因为符号引用的字面量明确定义在Java虚拟机规范的Class文件格式中;
  • 直接引用(Direct References):直接引用可以是直接指向目标的指针、相对偏移量或是一个能简介定位到目标的句柄。直接引用是和虚拟机实现的内存布局相关的,同一个符号引用在不同虚拟机实例上翻译出来的直接引用一般不同,有了直接引用,那引用的目标必定已经在内存中存在。

虚拟机规范中并未规定解析阶段发生的具体时间,只要求在执行anewarray、checkcast、getfield、getstatic、instanceof、invokeddynamic、invokeinterface、invokespecial、invokestatic、invokevirtual、ldc、ldc_w、multianewarray、new、putfield、putstatic这16个操作符号引用的字节码指令之前,先对他们使用的符号引用进行解析,所以虚拟机实现可以根据需要来判断到底是在类加载器加载时就对常量池的符号引用进行解析,还是等到一个符号引用要被使用前才去解析它。

对一个符号引用进行多次解析请求是很常见的事情,除invokedynamic指令外,虚拟机实现可以对第一次解析的结果进行缓存(在运行时常量池中记录直接引用,并把常量标识为已解析状态)从而避免解析动作重复进行。无论是否真正执行了多次解析动作,虚拟机需要保证的是在同一个实体中,如果一个符号引用之前已经被成功解析过,那么后续的引用解析请求就应当一直成功。如果第一次解析失败了,其他指令对这个符号解析请求也应该收到同样的异常。

解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符,下面介绍一下前四点。

类或接口的解析

假设当前代码所处的类为D,要把一个从未解析过得符号引用N解析为一个类或接口C的直接引用,过程分为以下三步:

  • 如果C不是一个数组类型,虚拟机会把代表N的全限定名传递给D的类加载器去加载C,在加载过程中,可能触发其他相关类的加载动作,例如加载这个类的父类或实现的接口,一旦加载过程中出现了任何异常,解析过程就宣告失败;
  • 如果C是一个数组类型,并且元素类型为对象,会按照上一步的规则加载数组元素类型,接着由虚拟机生成一个代表此数组维度和元素的数组对象;
  • 如果上述步骤没有任何异常,那么C在虚拟机中实际上已经成为一个有效的类或接口了,但在解析完成之前还要进行符号引用验证,确认D是否具备对C的访问权限,如果不具备,抛出Java.lang.IllegalAccessError异常。
字段解析

要解析一个未被解析过的字段符号引用,首先会将字段表内class_index项中索引的CONSTANT_Class_info符号引用进行解析,也就是字段所属的类或接口的符号引用。如果在解析这个类或接口符号引用的过程中出现了任何异常,都会导致字段符号引用解析的失败。如果解析成功完成,就将这个字段所属的类或接口用C表示。然后按如下步骤进行后续字段的搜索:

  • 如果C本身就包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用,查找结束;
  • 否则,在C中实现了接口,将会按照继承关系从下往上递归搜索各个接口和它的父接口,如果接口中包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用,查找结束;
  • 否则,如果C不是java.lang.Object的话,将会按照继承关系从下往上搜索其父类,如果父类中包含了简单名称和字段描述符都与目标相匹配的字段,返回这个字段的直接引用,查找结束;
  • 否则,查找失败,抛出java.lang.NoSuchFieldError异常。
  • 如果查找成功返回了引用,对这个字段进行权限验证,如果发现不具备对字段的访问权限,抛出java.lang.IllegalAccessError异常。

在Java中,如果有一个同名字段同时出现在C的接口和父类中或同时在父类的多个接口出现,编译器将拒绝编译。

类方法解析

类方法解析的第一步与字段解析一样,也需要先解析出class_index项中索引的方法所属的类或接口的符号引用,如果解析成功,按下面几步进行类方法搜索:

  • 类方法和接口方法符号引用的常量类型定义是分开的,如果在类方法表中发现class_index中索引的C是个接口,直接抛出java.lang.IncompatibleClassChangeError异常;
  • 如果通过了第一步,在C中查找是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用,查找结束;
  • 否则,在C的父类中递归查找是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用,查找结束;
  • 否则,在类C实现的接口列表及它们的父接口之中递归查找是否有简单名称和描述符都与目标相匹配的方法,如果存在匹配的方法,说明C是一个抽象类,查找结束,抛出java.lang.AbstractMethodError异常;
  • 否则,宣告失败,抛出java.lang.NoSuchMethodError异常。
  • 如果查找成功返回了直接引用,将会对这个方法进行权限验证,如果发现不具备对此方法的访问权限,抛出java.lang.IllegalAccessError异常。
接口方法解析

接口方法解析也需要先解析出class_index项中索引的方法所属的类或接口的符号引用,如果解析成功,用C表示这个接口,按下面几步进行接口方法搜索:

  • 如果发现C是一个类而不是接口,直接抛出java.lang.IncompatibleClassChangeError异常;
  • 否则,在C中查找是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用,查找结束;
  • 否则,在接口C的父接口中递归查找,直到java.lang.Object为止,看是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用,查找结束;
  • 否则,宣告失败,抛出java.lang.NoSuchMethodError异常;
  • 接口中的方法默认都是public的,不存在权限访问的问题,不会抛出java.lang.IllegalAccessError异常。
初始化

初始化是类加载过程的最后一步,初始化阶段真正开始执行类中定义的程序代码(字节码)。

在初始化阶段根据程序去初始化类变量和其他资源,即执行类构造器< clinit >()方法的过程,< clinit >方法有以下特点:

  • < clinit >()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{})块中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序所决定的,静态语句块中只能访问到定义在静态语句块之前的变量定义在他们之后的变量,在前面的静态语句块可以赋值,但是不能访问。如下一个例子:
public class IllegalForwardReference {
    static {
        i = 0;

        System.out.println(i);   //提示“Illegal Forward Reference”
    }

    private static int i;
}
  • < clinit >()方法与类的构造函数(实例构造器< init >方法),它不需要显式地调用父类构造器,虚拟机会保证在子类的< clinit >()方法执行之前,父类的< clinit >()方法已经执行完毕,所以第一个执行< clinit >()方法的肯定是Object。所以父类的静态语句块优先于子类的变量赋值操作;
  • < clinit >()方法对于类或接口来说并不是必须的,如果一个类中没有静态语句块,也没有对变量的赋值操作,那么编译器可以不为这个类生成< clinit >()方法;
  • 接口中不能使用静态语句块,但仍然有变量初始化的赋值操作,因此接口与类一样都会生成< clinit >()方法,但接口与类不同的是,执行接口的< clinit >()方法不需要先执行父接口的< clinit >()方法,只有当父接口中定义的变量使用时,父接口才会初始化,另外,接口的实现类在初始化时也不会执行接口的< clinit >()方法;
  • 虚拟机会保证一个类的< clinit >()方法在多线程环境中被正确的加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的< clinit >()方法,其他线程都需要阻塞等待,直到活动线程执行< clinit >()方法完毕。如果在一个类的< clinit >()方法中有耗时很长的操作,就可能造成多个进程阻塞。看下面一个例子:
public class DeadLoopClass {
    static {
        if(true) {
            System.out.println(Thread.currentThread() + " init DeadLoopClass");
            while (true) {

            }
        }
    }

    public static void main(String[] args) {
        Runnable r = () -> {
            DeadLoopClass dlc = new DeadLoopClass();
        };

        Thread thread1 = new Thread(r);
        Thread thread2 = new Thread(r);
        thread1.start();
        thread2.start();
    }
}

thread1一直在循环,导致thread2一直处于阻塞状态。

类加载器

实现“通过一个类的全限定名来获取描述此类的二进制字节流”的动作的代码模块称为“类加载器”。

类与类加载器

对于任意一个类,都需要由加载它的类加载器和这个类本身一同确定其在Java虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名称空间。比较两个类是否相等,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则两个类必然不相等(equals()方法、isAssignableFrom()方法、isInstance()方法的返回结果为false,instanceof对象所属关系判断为false)。

package classloadtest;

import java.io.IOException;
import java.io.InputStream;

/**
 * @author Zhang
 * @date 2018/8/20
 * @Description
 */
public class ClassLoaderEqualsTest {
    public static void main(String[] args) throws Exception{
        ClassLoader loader1 = new ClassLoader() {
            @Override
            public Class<?> loadClass(String name) throws ClassNotFoundException {
                return super.loadClass(name);
            }
        };

        ClassLoader loader2 = new ClassLoader() {
            @Override
            public Class<?> loadClass(String name) throws ClassNotFoundException {
                return super.loadClass(name);
            }
        };


        Object obj1 = loader1.loadClass("classloadtest.ClassLoaderTest").newInstance();
        Object obj2 = loader2.loadClass("classloadtest.ClassLoaderTest").newInstance();

        System.out.println(obj1.getClass());
        System.out.println(obj1.equals(obj2));

    }
}

在上面的代码中,两个类加载器加载得到的对象不相等,输出false。

public class ClassLoaderTest {
    public static void main(String[] args) throws Exception{

        ClassLoader loader = new ClassLoader() {
            @Override
            public Class<?> loadClass(String name) throws ClassNotFoundException {
                try {
                    String fileName = name.substring(name.lastIndexOf(".")+1)+".class";

                    InputStream is = getClass().getResourceAsStream(fileName);
                    if(is == null){
                        return super.loadClass(name);
                    }

                    byte[] b = new byte[is.available()];
                    is.read(b);
                    return defineClass(name,b,0,b.length);
                }catch (IOException e){
                    throw new ClassNotFoundException(name);
                }
            }
        };

        Object obj = loader.loadClass("classloadtest.ClassLoaderTest").newInstance();

        System.out.println(obj.getClass());
        System.out.println(obj instanceof classloadtest.ClassLoaderTest);
    }
}

在上面的代码中,重写了loadClass方法,输出为false,这是因为虚拟机中存在了两个ClassLoaderTest类,一个是系统应用程序类加载器加载的,一个是自定义类加载器加载的,是两个独立的类。

双亲委派模型

从虚拟机角度来讲,只存在两种不同的类加载器:一种是启动类的加载器(Bootstrap ClassLoader),这个类加载器使用C++实现,是虚拟机自身的一部分;另一种就是其他的类加载器,这些加载器由Java实现,独立于虚拟机外部,并且全都继承自抽象类java.lang.ClassLoader。

从Java开发人员角度看,类加载器可以划分为以下三类:

  • 启动类加载器(Bootstrap ClassLoader):这个类加载器负责将存放在\lib目录中的,或者被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的类库加载到虚拟机内存中。启动类加载器无法被Java程序直接引用,用户在编写自定义类加载器时,如果需要把加载请求委派给引导类加载器,直接使用null代替即可。下面是ClassLoader.getClassLoader()的源码:
public ClassLoader getClassLoader() {
        ClassLoader cl = getClassLoader0();
        if (cl == null)
            return null;       //启动类加载器
        SecurityManager sm = System.getSecurityManager();
        if (sm != null) {
            ClassLoader.checkClassLoaderPermission(cl, Reflection.getCallerClass());
        }
        return cl;
    }

ClassLoader getClassLoader0() { return classLoader; }
  • 扩展类加载器(Extension ClassLoader):负责加载\lib\ext目录中的,或者被java.ext.dirs系统变量所指定的路径中的所有类库,开发者可以直接使用扩展类加载器;
  • 应用程序类加载器(Application ClassLoader):这个类加载器是系统类加载器,负责加载用户路径上所指定的类库,开发者可以直接使用这个类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下这个就是程序中默认的类加载器。

双亲委派模型(Parents Delegation Model)层次如下图所示,要求除了顶层的启动类加载器外,其余的类加载器都应当有自己的父类加载器。类加载器的父子关系是使用组合来复用父加载器的代码。
这里写图片描述

双亲委派的工作过程是:如果一个类加载器收到了类加载的请求,它首先不会去尝试加载这个类,而是把这个请求委派给父类加载器去执行,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求时,子加载器才会尝试自己去加载。

下面是ClassLoader的loadClass()方法源码:

protected Class<?> loadClass(String name, boolean resolve)
        throws ClassNotFoundException
    {
        synchronized (getClassLoadingLock(name)) {
            // First, check if the class has already been loaded
            Class<?> c = findLoadedClass(name);
            if (c == null) {
                long t0 = System.nanoTime();
                try {
                    if (parent != null) {
                        c = parent.loadClass(name, false);
                    } else {
                        c = findBootstrapClassOrNull(name);
                    }
                } catch (ClassNotFoundException e) {
                    // ClassNotFoundException thrown if class not found
                    // from the non-null parent class loader
                }

                if (c == null) {
                    // If still not found, then invoke findClass in order
                    // to find the class.
                    long t1 = System.nanoTime();
                    c = findClass(name);

                    // this is the defining class loader; record the stats
                    sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
                    sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
                    sun.misc.PerfCounter.getFindClasses().increment();
                }
            }
            if (resolve) {
                resolveClass(c);
            }
            return c;
        }
    }

在上面的代码中先检查是否c已被加载过,若没有则调用父加载器的loadClass(),如果父加载器为空就调用启动类加载器,如果父加载类加载失败,就调用自己的findClass()方法加载。

违反双亲委派模型的情况

有三种违反双亲委派模型的情况:

  • 重写loadClass()方法;
  • 线程上下文加载器可以用父类加载器请求子类加载器完成类加载动作,如JNDI、JDBC、JCE等;
  • OSGi类加载器的实现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值