1、前言
首先我们看以下一段代码,这段代码的输出顺序是怎样的那?
/**
* 类加载顺序测试
*
* @author sj
*
*/
public class ClassloadTest {
public static void main(String[] args) {
System.out.println("--第一次加载开始--");
ChildB childB = new ChildB();
System.out.println("--第一次加载结束--");
System.out.println();
System.out.println("--第二次加载开始--");
ChildB childB2 = new ChildB(2);
System.out.println("--第二次加载结束--");
}
}
/**
* 父类
*
* @author sj
*
*/
public class SuperA {
private Param paramA = new Param("我是父类成员变量A");
private static Param paramB = new Param("我是父类静态成员变量B");
{
System.out.println("我是父类代码块");
}
static {
System.out.println("我是父类静态代码块");
}
public SuperA() {
System.out.println("我是父类无参构造函数");
}
public SuperA(int i) {
System.out.println("我是父类有参构造函数");
}
}
/**
* 子类
*
* @author sj
*
*/
public class ChildB extends SuperA {
static {
System.out.println("我是子类静态代码块");
}
public ChildB() {
System.out.println("我是子类无参构造函数");
}
{
System.out.println("我是子类代码块");
}
private Param paramA = new Param("我是子类成员变量A");
public ChildB(int i) {
System.out.println("我是子类有参构造函数");
}
private static Param paramB = new Param("我是子类静态成员变量B");
}
/**
* 成员变量
*
* @author sj
*
*/
public class Param {
public Param(String content) {
System.out.println(content);
}
}
输出结果如下:
–第一次加载开始–
我是父类静态成员变量B
我是父类静态代码块
我是子类静态代码块
我是子类静态成员变量B
我是父类成员变量A
我是父类代码块
我是父类无参构造函数
我是子类代码块
我是子类成员变量A
我是子类无参构造函数
–第一次加载结束–
–第二次加载开始–
我是父类成员变量A
我是父类代码块
我是父类无参构造函数
我是子类代码块
我是子类成员变量A
我是子类有参构造函数
–第二次加载结束–
由此可见,类新建实例时加载顺序如下:
父类静态成员变量或代码块 —》子类静态成员变量或代码块 —》父类成员变量或代码块 —》父类构造方法 —》子类成员变量或代码块 —》子类构造方法
其中相同类型的成员变量或代码块按顺序来,静态成员变量或者代码块只有在第一次新建实例时才加载。
此时笔者会想一个问题,为什么按这样的顺序加载的?由此引申出以下的类加载过程。
2、虚拟机类加载过程
2.1、类加载的时机
类的整个生命周期指从被加载到虚拟机内存开始,到卸载出内存截止,这些过程包括加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(UNloading)七个阶段。如下图所示:
在上面的示例中,当new 一个实例时,其实是触发了类的初始化过程。以下是5种触发类进行初始化的场景:
- 当遇到new、getstatic、putstatic或invokestatic这4条字节码时,如果类没有进行过初始化,则需要先触发其初始化。这4条指令对应的Java代码场景分别是:使用new实例化对象时、读取或设置一个类的静态字段时(被final修饰、已在编译期把结果放入常量池的静态字段除外)和调用一个类的静态方法时。
- 使用java.lang.reflect包的方法对类进行反射调用的时候。
- 当初始化一个类的时候,发现其父类没有初始化,则先触发其父类的初始化。
- 当虚拟机启动时,用户需要指定一个要执行的主类(包括main方法的那个类),虚拟机会先初始化这个主类。
- 当使用jdk1.7的动态语言支持时,若一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄对应的类没有进行初始化,则需要先触发其初始化。
除此之外,所有引用类的方式都不会触发初始化,称为被动引用。
2.2、类加载的过程
2.2.1、加载
在加载阶段,虚拟机需要完成以下3件事情:
- 通过一个类的全限定名来获取定义此类的二进制字节流。
- 将这个字节流所代表的的静态存储结构转化为方法区的运行时数据结构。
- 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据访问入口。
以上3条其实都不算具体,因此虚拟机实现与具体应用的灵活度是相当大的。例如第1条,它并没有指明二进制字节流要从一个class文件中获取,也就是说没有指明要从哪里获取、怎么获取。所以可以从ZIP、JAR、EAR和WAR包中读取,也可以从网络中获取(如Applet技术),还可以使用动态代理技术,也可以由其他文件生成(如JSP应用)。
加载阶段与连接阶段的部分内容是交叉进行的。
2.2.2、验证
验证是连接阶段的第一步,目的就是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
从整体上看,验证阶段大致可以分为以下4个阶段的校验动作:文件格式验证(是否符合Class文件格式的规范)、元数据验证(是否符合Java语言规范)、字节码验证(通过数据流和控制流分析,来判断程序语义是否是合法的、符合逻辑的)及符号引用验证(对类自身以外比如常量池中的各种符号引用进行匹配性校验,确保解析能正常进行)。
2.2.3、准备
正式为类变量(静态变量)分配内存并设置初始值的阶段,这些变量所用的内存都将在方法区中分配。假设有一个类变量的定义为:
public static int value = 1;
那变量在准备阶段的初始值为0而不是1,在初始化阶段才会设置为1。
如果类变量对应的属性为常量,例如:
public static final int value = 1;
则此时准备阶段的初始值就是为1。
2.2.4、解析
解析阶段是将常量池内的符号引用替换为直接引用的过程。符号引用与直接引用的定义如下:
- 符号引用(Symbolic References):以一组符号来描述引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义的定位到目标即可。与虚拟机的内存布局无关,引用的目标不一定已经加载到内存中。不同的虚拟机,符号引用必须是一致的,因为明确定义在虚拟机规范的Class文件格式中了。
- 直接引用(Direct References):直接引用可以是直接指向目标的指针、相对偏移量或一个能间接定位到目标的句柄。和内存布局相关,如果有了直接引用,那么引用的目标必定已经存在内存中。同一符号引用在不同虚拟机实例中翻译出来的直接引用一般不会相同。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行。
2.2.5、初始化
初始化阶段是类加载过程的最后一步,前面的类加载过程中,除了在加载阶段用户应用程序可以通过自定义类加载器参与之外,其余动作完全由虚拟机主导和控制。到了初始化阶段,才真正执行类中定义的Java程序代码。
在准备阶段,变量已经赋值过系统要求的初始值,而在初始化阶段,则通过程序员写的代码去初始化类变量和其他变量。初始化是执行类构造器()方法的过程。具体细节如下:
- clinit()方法是有编译器自动收集类的所有类变量的赋值动作和静态代码块的语句合并产生的,收集的顺序是有语句的顺序决定的。
- clinit()方法与类的构造函数不同,虚拟机会保证在子类clinit()方法执行之前,父类的clinit()方法已经执行完毕。因此父类的静态语句要优先于子类的静态语句。
- 虚拟机会保证类的clinit()方法在多线程环境中被正确的加锁、同步,也就是静态变量是线程安全的。
参考:
深入理解Java虚拟机第7章-周志明