类加载器负责将.class文件(可能在磁盘上,也可能在网络上)加载到内存中,并为之生成对应的java.lang.Class对象。
一、类加载机制
类加载器负责加载所有的类,系统为所有被载入内存中的类生成一个java.lang.Class实例。一旦一个类被载入JVM中,同一个类就不会被再次载入了。在JVM中,一个类用其全限定类名和其类加载器作为唯一标识。
当JVM启动时,会形成由三个类加载器组成的初始类加载器层次结构:
- Bootstrap ClassLoader:根类加载器,加载jre/lib/rt.jar、charset.jar等核心类,由C++实现;
- Extension ClassLoader:扩展类加载器,加载扩展jar包,jre/lib/ext/*.jar,或由-Djava.ext.dirs指定;
- System ClassLoader:系统类加载器,加载classpath指定内容。
Bootstrap ClassLoader被称为引导(也成为原始或根)类加载器,它负责加载Java的核心类。在Sun的JVM中,当执行java.exe命令时,使用-Xbootclasspath或-D选项指定sun.boot.class.path系统属性值可以指定加载附加的类。
JVM的类加载机制主要有如下三种:
- 全盘负责:所谓全盘负责,就是当一个类加载器负责加载某个Class时,该Class所依赖的和引用的其他Class也将由该类加载器负责载入,除非显示使用另外一个类加载器来载入。
- 父类委托:所谓父类委托,则是先让parent(父)类加载器试图加载该Class,只有在父类加载器无法加载该类时才尝试从自己的类路径中加载该类。
- 缓存机制:缓存机制将会保证所有加载过的Class都会被缓存,当程序中需要使用某个Class时,类加载器先从缓存区中搜寻该Class,只有当缓存区中不存在该Class对象时,系统才会读取该类对应的二进制数据,并将其转换成Class对象,存入到缓存区中。这就是为什么修改了Class后,必须重新启动JVM,程序所做的修改才会生效的原因。
注:类加载器之间的父子关系并不是类继承上的父子关系,这里的父子关系是类加载器实例之间的关系。
除了可以使用Java提供的类加载器之外,也可以通过继承ClassLoader来实现自定义的类加载器。
JVM的根类加载器不是Java实现的,而且由于程序通常无须访问根类加载器,因此访问扩展类加载器的父类加载器时返回null。但实际上,扩展类加载器的父类加载器时根类加载器。
jdk8中,系统类加载器时AppClassLoader的实例,扩展类加载器是ExtClassLoader的实例。实际上,这两个类都继承URLClassLoader类0,因此也都是URLClassLoader类的实例。
类加载器加载Class大致要经过如下8个步骤:
- 检测此Class是否载入过(即在缓存区中是否有此Class),如果有则直接进入第8步,否则接着执行第2步;
- 如果父类加载器不存在(如果没有父类加载器,则要么parent一定是根类加载器,要么本身就是根类加载器),则直接执行第3步;如果父类加载器存在,则继续执行第2步;
- 请求使用根类加载器来载入目标类,如果成功载入则跳到第9步,如果未成功若当前类加载器就是根类加载器则跳到第8步,否则接着执行第4步;
- 请求使用扩展类加载器来载入目标类,如果成功载入则跳到第9步,如果未成功若当前类加载器就是扩展类加载器则跳到第8步,否则接着执行第5步;
- 请求使用系统类加载器来载入目标类,如果成功载入则跳到第9步,如果未成功若当前类加载器就是系统类加载器则跳到第8步,否则接着执行第6步;
- 当前类加载器尝试寻找Class文件(从与此ClassLoader相关的类路径中寻找),如果找到则执行第7步,如果找不到则跳到第8步;
- 从文件中载入Class,成功载入后跳到第8步;
- 抛出ClassNotFoundException异常;
- 返回对应的java.lang.Class对象。
注:其中,第6、7步允许重写ClassLoader的findClass()方法来实现自己的载入策略,甚至重写loadClass()方法来实现自己的载入过程。
下图为类加载器加载Class过程的流程图:
二、双亲委派机制
JVM中类加载采用双亲委派机制,所谓双亲委派就是当一个类加载器收到类加载请求时他不会直接去加载目标类,而是把该请求委托给父类加载器去加载。只有当你父类加载器无法加载目标类时,才会交由当前类加载器加载目标类。
采用双亲委派机制,保证了安全性,避免核心类库被自定义类加载器加载,也避免了类被重复加载。
下图为双亲委派机制的流程图。
三、自定义类加载器
JVM中除根类加载器之外的所有类加载器都是ClassLoader子类的实例,可以通过扩展ClassLoader的子类,并重写该ClassLoader所包含的方法来实现自定义的类加载器。ClassLoader中包含大量的protected方法——这些方法都可被子类重写。
ClassLoader类有两个关键方法:
- findClass(String name):根据指定名称来查找类。
- loadClass(String name, boolean resolve):该方法为ClassLoader的入口点,根据指定名称来加载类,系统就是调用ClassLoader的该方法来获取指定类对应的Class对象。loadClass()方法的执行步骤如下:
①.用findLoadedClass(String)来检查是否已经加载类,如果已经加载则直接返回。
②.在父类加载器上调用loadClass()方法。如果父类加载器为null,则使用根类加载器来加载。
③.调用findClass(String)方法查找类。
从上面步骤可以看出,重写findClass()方法可以避免覆盖默认类加载器的父类委托、缓冲机制两种策略;如果重写loadClass()方法则实现逻辑更为复杂。
ClassLoader里还有一个核心方法:Class defineClass(String name, byte[] b, int off, int len),该方法负责将指定类的字节码文件(即Class文件)读入字节数组byte[] b内,并把它转换为Class对象,该字节码文件可以来源于文件、网络等、defineClass()方法管理JVM的许多复杂的实现,它负责将字节码分析成运行时数据结构,并校验有效性等。该方法是final的,不可重写。
除此之外,ClassLoader里还包含如下一些普通方法。
- findSystemClass(String name):从本地文件系统装入文件。它在本地文件系统中寻找类文件,如果存在,就使用defineClass()方法将原始字节转换成Class对象,以将该文件转换成类;
- static getSystemClassLoader():返回系统类加载器;
- getParent():获取该类加载器的父类加载器;
- resolveClass(Class<?> c):链接指定的类。类加载器可以使用此方法来链接类c;
- findLoadedClass(String name):如果此Java虚拟机已经加载了名为name的类,则直接返回该类对应的Class实例,否则返回null。该方法是Java类加载缓存机制的体现。
四、URLClassLoader类
Java为ClassLoader提供了一个URLClassLoader实现类,该类也是系统类加载器和扩展类加载器的父类(此处的父类,就是指类与类之间的继承关系)。URLClassLoader功能比较强大,它既可以从本地文件系统获取二进制文件来加载类,也可以从远程主机获取二进制文件来加载类。
在应用程序中可以直接使用URLClassLoader加载类,URLClassLoader类提供了如下两个构造器。
- URLClassLoader(URL[] urls):使用默认的父类加载器创建一个ClassLoader对象,该对象将从urls所指定的系列路径来查询并加载类。
- URLClassLoader(URL[] urls, ClassLoader parent):使用指定的父类加载器创建一个ClassLoader对象,其他功能与前一个构造器相同。
一旦得到了URLClassLoader对象之后,就可以调用该对象的loadClass()方法来加载指定类。