JVM类加载机制和类加载器
Java虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型
与那些在编译时需要进行连接的语言不同,在Java语言里面,类型的加载、连接和初始化过程都是在程序运行期间完成的
这种策略让Java语言进行提前编译会面临额外的困难,也会让类加载时稍微增加一些性能开销,但是却为Java应用提供了极高的扩展性和灵活性
Java天生可以动态扩展的语言特性就是依赖运行期动态加载和动态连接这个特点实现的
类加载的时机
一个类型从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期
加载、验证、准备、初始化和卸载这五个阶段的顺序是确定的,类型的加载过程必须按照这种顺序按部就班地开始,而解析阶段则不一定。它在某些情况下可以在初始化阶段之后再开始,这是为了支持Java语言的运行时绑定特性(也称为动态绑定或晚期绑定)。
1.加载
加载需要完成三件事,获取字节流,转换结构,生成Class对象
- 通过一个类的全限定名来获取定义此类的二进制字节流
其中没有说明从哪里获取、如何获取,相当灵活,开发,这也是Java优势
- 从ZIP压缩包中读取,这很常见,最终成为日后JAR、EAR、WAR格式的基础
- 从网络中获取,这种场景最典型的应用就是Web Applet
- 运行时计算生成,这种场景使用得最多的就是动态代理技术,为特定接口生成代理类的二进制字节流。
- 由其他文件生成,典型场景是JSP应用,由JSP文件生成对应的Class文件。
- 从数据库中读取,这种场景相对少见些,例如有些中间件服务器(如SAP Netweaver)可以选择把程序安装到数据库中来完成程序代码在集群间的分发。
- 可以从加密文件中获取,这是典型的防Class文件被反编译的保护措施,通过加载时解密Class文件来保障程序运行逻辑不被窥探。
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
非数组类型的加载是开发人员可控性最强的阶段,加载阶段既可以使用Java虚拟机里内置的引导类加载器来完成
开发人员通过定义自己的类加载器去控制字节流的获取方式(重写一个类加载器的findClass()或loadClass()方法),实现根据自己的想法来赋予应用程序获取运行代码的动态性。
数组类型本身不通过类加载器创建,它是由Java虚拟机直接在内存中动态构造出来的。
- 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口
2.验证
验证是连接阶段的第一步,这一阶段的目的是确保Class文件的字节流中包含的信息符合《Java虚拟机规范》的全部约束要求,保证这些信息被当作代码运行后不会危害虚拟机自身的安全。
Java语言本身是相对安全的编程语言(起码对于C/C++来说是相对安全的),使用纯粹的Java代码无法做到诸如访问数组边界以外的数据、将一个对象转型为它并未实现的类型、跳转到不存在的代码行之类的事情,如果尝试这样去做了,编译器会毫不留情地抛出异常、拒绝编译。- 编译器bug识别能力强
验证阶段-文件格式验证、元数据验证、字节码验证和符号引用验证
- 文件格式验证
- 是否以魔数0xCAFEBABE开头。
- 主、次版本号是否在当前Java虚拟机接受范围之内。
- 常量池的常量中是否有不被支持的常量类型(检查常量tag标志)。
- 指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量。
- CONSTANT_Utf8_info型的常量中是否有不符合UTF-8编码的数据。
第一阶段-文件格式验证是是保证输入的字节流能正确地解析并存储于方法区之内,格式上符合描述一个Java类型信息的要求。
这阶段的验证是基于二进制字节流进行的,只有通过了这个阶段的验证之后,这段字节流才被允许进入Java虚拟机内存的方法区中进行存储
后面的三个验证阶段全部是基于方法区的存储结构上进行的,不会再直接读取、操作字节流了
- 元数据验证
第二阶段的主要目的是对类的元数据信息进行语义校验
- 这个类是否有父类(除了java.lang.Object之外,所有的类都应当有父类)。
- 这个类的父类是否继承了不允许被继承的类(被final修饰的类)。
- 如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法。
- 类中的字段、方法是否与父类产生矛盾(例如覆盖了父类的final字段,或者出现不符合规则的方法重载,例如方法参数都一致,但返回值类型却不同等)。
- 字节码验证
这阶段就要对类的方法体(Class文件中的Code属性)进行校验分析,保证被校验类的方法在运行时不会做出危害虚拟机安全的行为
- 符号引用验证
最后一个阶段的校验行为发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在连接的第三阶段——解析阶段中发生
符号引用验证可以看作是对类自身以外(常量池中的各种符号引用)的各类信息进行匹配性校验,通俗来说就是,该类是否缺少或者被禁止访问它依赖的某些外部类、方法、字段等资源。
3.准备
准备阶段是正式为类中定义的变量(即静态变量,被static修饰的变量)分配内存并设置类变量初始值的阶段
在JDK 7及之前,HotSpot使用永久代来实现方法区时,存放变量
在JDK 8及之后,类变量则会随着Class对象一起存放在Java堆中
4.解析
解析阶段是Java虚拟机将常量池内的符号引用替换为直接引用的过程
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符这7类符号引用进行
5.初始化
直到初始化阶段,Java虚拟机才真正开始执行类中编写的Java程序代码,将主导权移交给应用程序。
进行准备阶段时,变量已经赋过一次系统要求的初始零值,而在初始化阶段,则会根据程序员通过程序编码制定的主观计划去初始化类变量和其他资源。
注意:对于初始化阶段,《Java虚拟机规范》严格规定了有且只有六种情况必须立即对类进行“初始化”(而加载、验证、准备自然需要在此之前开始)
- new、getstatic、putstatic或invokestatic这四条字节码指令时
如果类型没有进行过初始化,则需要先触发其初始化阶段。能够生成这四条指令的典型Java代码场景有:
- 使用new关键字实列化对象
- 读取或设置一个类型的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)
- 调用一个类型的静态方法的时候
- 使用java.lang.reflect包的方法对类型进行反射调用的时候
如果类型没有进行过初始化,则需要先触发其初始化。
- 当初始化类的时候
如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
- 当虚拟机启动时
用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先初始化这个主类
类加载器
Java虚拟机设计团队有意把类加载阶段中的“通过一个类的全限定名来获取描述该类的二进制字节流”这个动作放到Java虚拟机外部去实现,以便让应用程序自己决定如何去获取所需的类。实现这个动作的代码被称为“类加载器”(Class Loader)。
类加载器虽然只用于实现类的加载动作,但它在Java程序中起到的作用却远超类加载阶段。
任意一个类,都必须由加载它的类加载器和这个类本身一起共同确立其在Java虚拟机中的唯一性
比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则,即使这两个类来源于同一个Class文件,被同一个Java虚拟机加载,只要加载它们的类加载器不同,那这两个类就必定不相等。
站在Java虚拟机(HotSpot)的角度来看,只存在两种不同的类加载器
- 启动类加载器 Bootstrap Class Loader,C++语言实现,虚拟机自身的一部分
- 其他所有的类加载器,Java语言实现,虚拟器外部,全都继承自抽象类java.lang.ClassLoader。
站在Java开发人员的角度来看,jdk9之前,JDK 9之前的Java应用都是由这三种类加载器互相配合来完成加载的,如果用户认为有必要,还可以加入自定义的类加载器来进行拓展
-
启动动类加载器
-
扩展类加载器 Extension Class Loader
-
应用程序类加载器 Application Class Loader
-
其他自定义类加载器 User Class Loader
1.双亲委派模型
自JDK 1.2以来,Java一直保持着三层类加载器、双亲委派的类加载架构,如图
双亲委派模型 Parents Delegation Model:各种类加载器之间的层次关系
双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应有自己的父类加载器。
不过这里类加载器之间的父子关系一般不是以继承(Inheritance)的关系来实现的,而是通常使用
组合(Composition)关系来复用父加载器的代码。
- 双亲委派模型的工作过程
如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此
因此所有的加载请求最终都应该传送到最顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去完成加载。
其实就是先pin爹pin爷爷,然后都没用才自己工作
- 双亲委派模型的作用
组织类加载器之间的关系,一个显而易见的好处就是Java中的类随着它的类加载器一起具备了一种带有优先级的层次关系。
例如类java.lang.Object,它存放在rt.jar之中,无论哪一类加载器要加载这个类,最终都是委派给处于模型最顶端的启动类加载器进行加载
因此Object类在程序的各种类加载器环境中都能够保证是同一个类。
- 实现
全部集中在java.lang.ClassLoader的loadClass()方法之中
/**
* Loads the class with the specified <a href="#name">binary name</a>. The
* default implementation of this method searches for classes in the
*
* @param name
* The <a href="#name">binary name</a> of the class
*
* @param resolve
* If {@code true} then resolve the class
*
* @return The resulting {@code Class} object
*
* @throws ClassNotFoundException
* If the class could not be found
*/
protected Class<?> loadClass(String name, boolean resolve)
throws ClassNotFoundException
{
synchronized (getClassLoadingLock(name)) {
// 首先,检查请求的类是否已经被加载过了
Class<?> c = findLoadedClass(name);
if (c == null) {
long t0 = System.nanoTime();
try {
if (parent != null) {
c = parent.loadClass(name, false);
} else {
c = findBootstrapClassOrNull(name);
}
} catch (ClassNotFoundException e) {
// 如果父类加载器抛出ClassNotFoundException
// 说明父类加载器无法完成加载请求
}
if (c == null) {
// 在父类加载器无法加载时
// 再调用本身的findClass方法来进行类加载
long t1 = System.nanoTime();
c = findClass(name);
// 这是定义类加载器; 记录统计数据
PerfCounter.getParentDelegationTime().addTime(t1 - t0);
PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
PerfCounter.getFindClasses().increment();
}
}
if (resolve) {
resolveClass(c);
}
return c;
}
}
1.先检查请求加载的类型是否已经被加载过
2.若没有则调用父加载器的loadClass()方法
3.若父加载器为空则默认使用启动类加载器作为父加载器。
4.假如父类加载器加载失败,抛出ClassNotFoundException异常的话,才调用自己的findClass()方法尝试进行加载。
2.破坏双亲委派模型(了解)
直到Java 模块化出现为止,双亲委派模型主要出现过3次较大规模“被破坏”的情况
- 第一次“被破坏”其实发生在双亲委派模型出现之前,jdk2之前
类加载器的概念和抽象类 java.lang.ClassLoader则在Java的第一个版本中就已经存在,面对已经存在的用户自定义类加载器的代 码,Java设计者们引入双亲委派模型时不得不做出一些妥协
为了兼容这些已有代码,无法再以技术手段避免loadClass()被子类覆盖的可能性,只能在JDK 1.2之后的java.lang.ClassLoader中添加一个新的 protected方法findClass(),并引导用户编写的类加载逻辑时尽可能去重写这个方法,而不是在 loadClass()中编写代码
如果父类加载失败,会自动调用自己的findClass()方法来完成加载,这样既不影响用户按照自己的意愿去加载类,又可以保证新写出来的类加载器是符合双亲委派规则的。
- 第二次“被破坏”是由这个模型自身的缺陷导致的
双亲委派很好地解决了各个类 加载器协作时基础类型的一致性问题(越基础的类由越上层的加载器进行加载),如果有基础类型又要调用回用户的代码
设计团队引入了一个不太优雅的设计:线程上下文类加载器Thread Context ClassLoader
这个类加载器可以通过java.lang.Thread类的setContext-ClassLoader()方法进行设置,如果创建线程时还未设置,它将会从父线程中继承一个,如果在应用程序的全局范围内都没有设置过的话,那这个类加载器默认就是应用程序类加载器
- 第三次“被破坏”是由于用户对程序动态性的追求而导致的
动态性:代码热替换(Hot Swap)、模块热部署(Hot Deployment)等
实现模块化热部署的关键是它自定义的类加载器机制的实现,每一个程序模块都有一个自己的类加载器,当需要更换一个Bundle时,就把Bundle连同类加载器一起换掉以实现代码的热替换。
在OSGi环境下,类加载器不再双亲委派模型推荐的树状结构,而是进一步发展为更 加复杂的网状结构,当收到类加载请求时,OSGi将按照下面的顺序进行类搜索:
将以java.*开头的类,委派给父类加载器加载
否则,将委派列表名单内的类,委派给父类加载器加载
否则,将Import列表中的类,委派给Export这个类的Bundle的类加载器加载
否则,查找当前Bundle的ClassPath,使用自己的类加载器加载
否则,查找类是否在自己的Fragment Bundle中,如果在,则委派给Fragment Bundle的类加载器
加载
否则,查找Dynamic Import列表的Bundle,委派给对应Bundle的类加载器加载
否则,类查找失败。
上面的查找顺序中只有开头两点仍然符合双亲委派模型的原则,其余的类查找都是在平级的类加 载器中进行的