java类是如何到JVM执行的?
本文是对.java文件到JVM运行的一个过程讲解,其中涉及到相关概念及原理。
一、java类
类一般包含属性、代码块、构造器、方法、内部类。
二、JDK
JDK是java开发工具包,包括: bin、db、include、jre、ilb文件。其中:
bin是JDK的编译器(javac.exe);
db是自带的数据库;
Include是java和JVM交互的的头文件;
jre是java运行的环境,jre文件里面的bin文件可以看成jvm,
lib文件则是jvm工作时所需要的的类库,jvm和lib一起称为jre。
三、类的编译
java体系中有三种编译方式:前端编译、即时编译(JIT)、静态提前编译(AOT),后两种编译方式也叫后端编译,也是运行时进行的编译。现在主要是通过前端编译+JIT编译方式:
1.前端编译
通过javac编译器(JDK的bin文件)把*.java文件转换为*.class文件的过程。
2.即时编译(JIT)
通过Java虚拟机(JVM)内置的即时编译器(Just In Time Compiler,JIT编译器),在运行时(文件加载内存中运行)把Class文件字节码编译成本地机器码的过程。
3.静态提前编译(AOT)
程序运行前,直接把Java源码文件(.java)编译成本地机器码的过程。
因为Java语言的动态性(如反射)带来了额外的复杂性,影响了静态编译代码的质量;
一般静态编译不如JIT编译的质量,这种方式用得比较少;
四、JVM加载.class
JVM即java虚拟机,会加载.calss文件。它包含三个子系统:类加载子系统、执行时数据区、执行引擎。
1.类加载子系统
类加载子系统负责动态加载类,在运行时(而非编译时),当一个类初次被引用的时候,它将被加载、连接、初始化,也是经常被提到的类加载过程。
-
加载
加载过程包括以下加载器:
1.1 启动类加载器
1.2 扩展类加载器
1.3 应用程序加载器
1.4 用户自定义加载器
以上类加载器通过双亲委派模型执行类加载,双亲委派模型是自底向上去校验类是否被加载,如果没有被加载,是自上而下去查找类并加载。双亲委派的作用是保证JDK的核心类优先加载。
为什么要打破双亲委派机制
比如:我们常用数据库驱动Driver接口,Driver定义在jdk当中,当其实现却是各个数据库服务商,例如,mysql的MYSQL CONNECROR,所有这就有个问题,DriverManger要加载各个Driver接口实现类,然后进行管理,但是DriverManager是由启动类加载器进行加载的,而这个启动类加载器默认值加载JAVA_HOME下面的lib,但我们真正要加载的是各个实现类,需要有系统类加载器进行加载,这个时候就需要启动类加载器委托系统类加载器去加载Driver实现类,从而破坏了双亲委派。
如何打破双亲委派:
1.1 自定义类加载器 ,重写loadclass方法。典型的打破双亲委派模型的框架和中间件有tomcat与osgi
1.2 SPI机制绕开loadclass 方法。当前线程设定关联类加载器 -
连接
连接包含三个步骤:验证、准备、解析
1.1 验证
文件格式验证->原数据验证->字节码验证->符合引用验证
1.2 准备 -
为 static 变量分配空间,设置默认值
-
static 变量在 JDK 7 之前存储于 instanceKlass 末尾,从 JDK 7 开始,存储于 _java_mirror 末尾
-
static 变量分配空间和赋值是两个步骤,分配空间在准备阶段完成,赋值在初始化阶段完成
-
如果 static 变量是 final 的基本类型,以及字符串常量,那么编译阶段值就确定了,赋值在准备阶段完成。比如:public static int value = 11,那么value 变量在准备阶段赋的值是0,而不是11,(初始化阶段才会赋值),特殊情况:比如给 value 变量加上了 final 关键字public static final int value=11 ,那么准备阶段 value 的值就被赋值为 11
-
如果 static 变量是 final 的,但属于引用类型,即 new 对象,那么赋值也会在初始化阶段完成
1.3 解析
解析阶段是虚拟机将常量值中的符号引用替换为直接引用的过程,解析动作主要针对类和接口,字段,类方法,接口方法,方法类型,方法句柄,方法的限定符 -
初始化
初始化即调用 < cinit >()V 方法,虚拟机会保证这个类的 【构造方法】的线程安全
发生的时机:
1.1 会导致类初始化的情况 -
main 方法所在的类,总会被首先初始化
-
首次访问这个类的 静态变量 或 静态方法 时
-
子类初始化,如果父类还未初始化,会引发
-
子类访问父类的静态变量,只会触发父类的初始化
-
Class.forName
-
new 会导致初始化
1.2不会导致类初始化的情况 -
访问 类的 static final 静态变量(基本类型和字符型)不会触发初始化
-
类对象.class 不会触发初始化
-
创建该类的数组不会触发初始化
-
类加载的 loadClass 方法
-
Class.forName 的参数2 为 false 时
类初始化顺序
1.1 静态变量、静态代码块初始化顺序级别一致,谁在前,就先初始化谁。从上而下初始化(只在类加载时,初始化一次)
1.2 非静态变量、非静态代码块初始化顺序级别一致,谁在前,就先初始化谁。从上而下初始化(只要对象实例化一次,就初始化一次)
1.3 构造方法在非静态变量、非静态代码块之后执行。
1.4 子类静态变量、静态代码块在父类的静态变量、静态代码块之后执行。
1.5 子类非静态变量、非静态代码块在父类构造方法之后执行。
1.6 子类构造方法在父类构造方法之后执行。
1.7 静态方法不会被子类重写。
2.执行时数据区
当程序运行时,JVM需要内存来存储许多内容,例如:字节码、对象、参数、返回值、局部变量、运算的中间结果,等等,JVM会把这些东西都存储到运行时数据区中,以便于管理。而运行时数据区又可以分为方法区、堆、虚拟机栈、本地方法栈、程序计数器。
3.执行引擎
负责执行那些包含在被载入类的方法中的指令
以上为.java到JVM运行的大概过程。