一、初识 JVM
1.什么是JVM
JVM 全称是 Java Virtual Machine,中文译名 Java虚拟机。
JVM 本质上是一个运行在计算机上的程序,他的职责是运行Java字节码文件。
2.JVM的功能
1.解释和运行
- 对字节码文件中的指令,实时的解释成机器码,让计算机执行
2.内存管理
- 自动为对象、方法等分配内存
- 自动的垃圾回收机制,回收不再使用的对象
3.即时编译
- 对热点代码进行优化,提升执行效率
常见的JVM
二、字节码文件详解
1.JVM的组成
2.字节码文件的组成
2.1字节码文件的组成部分-Magic魔数
- 文件是无法通过文件扩展名来确定文件类型的,文件扩展名可以随意修改,不影响文件的内容。
- 软件使用文件的头几个字节(文件头)去校验文件的类型,如果软件不支持该种类型就会出错。
- Java字节码文件中,将文件头称为magic魔数。
2.1.1字节码文件的组成部分-主副版本号
- 主副版本号指的是编译字节码文件的JDK版本号,主版本号用来标识大版本号,JDK1.0-1.1使用了
- 45.0-45.3,JDK1.2是46之后每升级一个大版本就加1;副版本号是当主版本号相同时作为区分不同版本的标识,一般只需要关心主版本号。
- 版本号的作用主要是判断当前字节码的版本和运行时的JDK是否兼容。
2.2.字节码文件的组成部分-常量池
字节码文件中常量池的作用:避免相同的内容重复定义,节省空间。
常量池中的数据都有一个编号,编号从1开始。在字段或者字节码指令中通过编号可以快速的找到对应的数据。
字节码指令中通过编号引用到常量池的过程称之为符号引用。
2.3字节码文件的组成部分-方法
字节码中的方法区域是存放字节码指令的核心位置,字节码指令的内容存放在方法的Code属性中。
操作数栈是临时存放数据的地方,局部变量表是存放方法中的局部变量的位置。
3.类的生命周期
类的生命周期描述了一个类加载、使用、卸载的整个过程
1.类的生命周期
2.类的生命周期 加载阶段
1、加载(Loading)阶段第一步是类加载器根据类的全限定名通过不同的渠道以二进制流的方式获取字节码信息。程序员可以使用Java代码拓展的不同的渠道。
2、类加载器在加载完类之后,Java虚拟机会将字节码中的信息保存到方法区中。
3、类加载器在加载完类之后,Java虚拟机会将字节码中的信息保存到内存的方法区中。生成一个InstanceKlass对象,保存类的所有信息,里边还包含实现特定功能比如多态的信息。
4、同时,Java虚拟机还会在堆中生成一份与方法区中数据类似的java.lang.Class对象。作用是在Java代码中去获取类的信息以及存储静态字段的数据(JDK8及之后)。
对于开发者来说,只需要访问堆中的Class对象而不需要访问方法区中所有信息。
这样Java虚拟机就能很好地控制开发者访问数据的范围。
3.类的生命周期 连接阶段之验证
连接(Linking)阶段的第一个环节是验证,验证的主要目的是检测Java字节码文件是否遵守了《Java虚拟机规范》中的约束。这个阶段一般不需要程序员参与。
主要包含如下四部分,具体详见《Java虚拟机规范》:
1.文件格式验证,比如文件是否以0xCAFEBABE开头,主次版本号是否满足当前Java虚拟机版本要求。
2.元信息验证,例如类必须有父类(super不能为空)。
3.验证程序执行指令的语义,比如方法内的指令执行到一半强行跳转到其他方法中去。
4.符号引用验证,例如是否访问了其他类中private的方法等。
4.类的生命周期 验证案例-版本号的检测
类的生命周期 连接阶段之准备
准备阶段为静态变量(static)分配内存并设置初始值。
准备阶段只会给静态变量赋初始值,而每一种基本数据类型和引用数据类型都有其初始值。
final修饰的基本数据类型的静态变量,准备阶段直接会将代码中的值进行赋值。
5.类的生命周期 连接阶段之解析
解析阶段主要是将常量池中的符号引用替换为直接引用。
符号引用就是在字节码文件中使用编号来访问常量池中的内容。
解析阶段主要是将常量池中的符号引用替换为直接引用。
直接引用不在使用编号,而是使用内存中地址进行访问具体的数据。
6.类的生命周期 初始化阶段
初始化阶段会执行静态代码块中的代码,并为静态变量赋值。
初始化阶段会执行字节码文件中clinit部分的字节码指令。
以下几种方式会导致类的初始化:
1.访问一个类的静态变量或者静态方法,注意变量是final修饰的并且等号右边是常量不会触发初始化。
2.调用Class.forName(String className)。
3.new一个该类的对象时。
4.执行Main方法的当前类。
三、类加载器
什么是类加载器
类加载器(ClassLoader)是Java虚拟机提供给应用程序去实现获取类和接口字节码数据的技术。
类加载器只参与加载过程中的字节码获取并加载到内存这一部分。
1.类加载器的分类
类加载器分为两类,一类是Java代码中实现的,一类是Java虚拟机底层源码实现的。
类加载器的设计JDK8和8之后的版本差别较大,JDK8及之前的版本中默认的类加载器有如下几种:
Arthas中类加载器相关的功能
类加载器的详细信息可以通过classloader命令查看:
classloader - 查看 classloader 的继承树,urls,类加载信息,使用 classloader 去 getResource
2.类加载器的分类
类加载器的设计JDK8和8之后的版本差别较大,JDK8及之前的版本中默认的类加载器有如下几种:
类加载器的分类-启动类加载器
启动类加载器(Bootstrap ClassLoader)是由Hotspot虚拟机提供的、使用C++编写的类加载器。
默认加载Java安装目录/jre/lib下的类文件,比如rt.jar,tools.jar,resources.jar等。
类加载器的分类-Java中的默认类加载器
扩展类加载器和应用程序类加载器都是JDK中提供的、使用Java编写的类加载器。
它们的源码都位于sun.misc.Launcher中,是一个静态内部类。继承自URLClassLoader。具备通过目录或者指定jar包将字节码文件加载到内存中。
类加载器的分类-扩展类加载器
扩展类加载器(Extension Class Loader)是JDK中提供的、使用Java编写的类加载器。
默认加载Java安装目录/jre/lib/ext下的类文件。
类加载器的分类-类加载器的
扩展类加载器和应用程序类加载器都是JDK中提供的、使用Java编写的类加载器。
它们的源码都位于sun.misc.Launcher中,是一个静态内部类。继承自URLClassLoader。具备通过目录或者指定jar包将字节码文件加载到内存中。
Arthas中类加载器相关的功能
类加载器的加载路径可以通过classloader –c hash值 查看:
3.双亲委派机制
3.1 类加载器的双亲委派机制
在Java中如何使用代码的方式去主动加载一个类呢?
方式1:使用Class.forName方法,使用当前类的类加载器去加载指定的类。
方式2:获取到类加载器,通过类加载器的loadClass方法指定某个类加载器加载。
在Idea中测试下面的案例:
每个Java实现的类加载器中保存了一个成员变量叫“父”(Parent)类加载器,可以理解为它的上级,并不是继承关系。
应用程序类加载器的parent父类加载器是扩展类加载器,而扩展类加载器的parent是空。
启动类加载器使用C++编写,没有上级类加载器。
3.2 Arthas中类加载器相关的功能
类加载器的继承关系可以通过classloader –t 查看:
3.3 类加载器的双亲委派机制
在类加载的过程中,每个类加载器都会先检查是否已经加载了该类,如果已经加载则直接返回,否则会将加载请求委派给父类加载器。
如果类加载的parent为null,则会提交给启动类加载器处理。
如果所有的父类加载器都无法加载该类,则由当前类加载器自己尝试加载。所以看上去是自顶向下尝试加载。
第二次再去加载相同的类,仍然会向上进行委派,如果某个类加载器加载过就会直接返回。
双亲委派机制指的是:自底向上查找是否加载过,再由顶向下进行加载。
双亲委派机制的作用
4.打破双亲委派机制
打破双亲委派机制的三种方式
1.打破双亲委派机制–自定义类加载器
- 一个Tomcat程序中是可以运行多个Web应用的,如果这两个应用中出现了相同限定名的类,比如Servlet类,Tomcat要保证这两个类都能加载并且它们应该是不同的类。
- 如果不打破双亲委派机制,当应用类加载器加载Web应用1中的MyServlet之后,Web应用2中相同限定名的MyServlet类就无法被加载了。
Tomcat使用了自定义类加载器来实现应用之间类的隔离。
每一个应用会有一个独立的类加载器加载对应的类。
- 先来分析ClassLoader的原理,ClassLoader中包含了4个核心方法。
- 双亲委派机制的核心代码就位于loadClass方法中。
5.JDK9之后的类加载器
JDK8及之前的类加载器
JDK8及之前的版本中,扩展类加载器和应用程序类加载器的源码位于rt.jar包中的sun.misc.Launcher.java。
由于JDK9引入了module的概念,类加载器在设计上发生了很多变化。
启动类加载器使用Java编写,位于jdk.internal.loader.ClassLoaders类中。
Java中的BootClassLoader继承自BuiltinClassLoader实现从模块中找到要加载的字节码资源文件。
2、扩展类加载器被替换成了平台类加载器(Platform Class Loader)。
平台类加载器遵循模块化方式加载字节码文件,所以继承关系从URLClassLoader变成了BuiltinClassLoader,BuiltinClassLoader实现了从模块中加载字节码文件。平台类加载器的存在更多的是为了与老版本的设计方案兼容,自身没有特殊的逻辑。