内存结构概述
简图:
- 其中方法区和堆为同一种颜色表示所有线程共享这两个区域。
- 计数器,本地方法栈和虚拟机栈线程独有。
- 执行引擎可以理解为操作系统
更加详细的过程:
- 类加载器子系统:加载,链接和初始化。
- 加载:典型的三个加载器,当然也可以自定义加载器
- 连接:分为验证,准备和解析三个过程
- 初始化化
- PC寄存器:每个线程一份
- 栈:值得虚拟机栈,每个结构称为栈帧,每个栈帧存在很多具体部分与结构。
- 本地方法栈:涉及到本地API调用的栈
- 堆区:主要用于创建对象。
- 方法区:主要用于常量的存取。
如果自己想手写一个Java虚拟机的话,主要考虑哪些结构呢?
- 类加载器
- 执行引擎
类加载器与类的加载过程
- 类加载器子系统负责从文件系统或者网络中加载Class文件,class文件在文件开头有特定的文件标识。
- ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定。
- 加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是Class文件中常量池部分的内存映射)
类加载器ClasLoader角色
- class file存在于本地硬盘上,相当于一种范式,而最终这个范式在程序运行的时候会被加载到JVM当中,虚拟机会根据这个文件实例化出n个一模一样的实例。
- class file加载到JVM中,被称为DNA元数据模板,放在方法区。
- 在. class文件->JVM->最终成为元数据模板,此过程就要一个运输工具(类装载器Class Loader),扮演一个快递员的角色。
类的加载过程
假设存在下列几行代码:
public class HelloLoader {
public static void main(String[] args) {
System.out.println("谢谢ClassLoader加载我....");
System.out.println("你的大恩大德,我下辈子再报!");
}
}
如果需要加载调用helloLoader中的main方法,会进行下面几个步骤:
完整的流程图如下所示:
如上所示,整个类的加载过程可以分类类加载阶段,连接阶段和初始化阶段
。
加载阶段
-
加载:
- 通过一个类的全限定名获取定义此类的二进制字节流(以流的方式加载物理磁盘)。
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构(把类存在方法区当中)。
- 在内存中生成一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的访问入口。(万物结尾对象,以对象作为访问入口)
-
加载class文件的方式:
- 从本地系统中直接加载
- 通过网络获取,典型场景:Web Applet
- 从zip压缩包中读取,成为日后jar、war格式的基础
- 运行时计算生成,使用最多的是:动态代理技术(反射动态代理)
- 由其他文件生成,典型场景:JSP应用从专有数据库中提取.class文件,比较少见
- 从加密文件中获取,典型的防Class文件被反编译的保护措施
链接阶段
链接分为三个子阶段:验证 -> 准备 -> 解析
-
验证(Verify): 目的在于确保Class文件的字节流中包含信息符合当前虚拟机要求, 保证被加载类的正确性,不会危害虚拟机自身安全。
主要包括四种验证:文件格式验证,元数据验证,字节码验证,符号引用验证。
举例:使用 BinaryViewer 软件查看字节码文件,其开头均为CAFE BABE
,如果出现不合法的字节码文件,那么将会验证不通过。
-
准备(Prepare): 为类变量(即静态变量)分配内存并且设置该类变量的默认初始值,即零值。 这里不包含用final修饰的static,因为final在编译的时候就会分配了,准备阶段会显式初始化;
这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中。
举例
代码:变量a在准备阶段会赋初始值,但不是1,而是0,在初始化阶段会被赋值为 1public class HelloApp { private static int a = 1;//prepare:a = 0 ---> initial : a = 1 public static void main(String[] args) { System.out.println(a); } }
-
解析(Resolve): 将常量池内的符号引用转换为直接引用的过程。 事实上,解析操作往往会伴随着JVM在执行完初始化之后再执行。
-
符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《java虚拟机规范》的Class文件格式中。
反编译 class 文件后可以查看符号引用,下面带# 的就是符号引用
-
直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
-
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的CONSTANT_Class_info,CONSTANT_Fieldref_info、CONSTANT_Methodref_info等
-
初始化阶段
类的初始化时机
- 创建类的实例
- 访问某个类或接口的静态变量,或者对该静态变量赋值
调用类的静态方法 - 反射(比如:Class.forName(“com.atguigu.Test”))
- 初始化一个类的子类
- Java虚拟机启动时被标明为启动类的类
- JDK7开始提供的动态语言支持:java.lang.invoke.MethodHandle实例的解析结果REF_getStatic、REF putStatic、REF_invokeStatic句柄对应的类没有初始化,则初始化
除了以上七种情况,其他使用Java类的方式都被看作是对类的被动使用,都不会导致类的初始化,即不会执行初始化阶段(不会调用 clinit() 方法和 init() 方法)
clinit()方法
- 初始化阶段就是执行类构造器方法
<clinit>()
的过程 - 此方法不需定义,由javac编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来 。也就是说,当我们代码中 包含static变量的时候,就会有clinit方法。
- <clinit>() 方法中的指令按语句在源文件中出现的顺序执行
- <clinit>() 不同于类的构造器。(关联:构造器是虚拟机视角下的
<init>()方法
) - 若该类具有父类,JVM会保证子类的<clinit>()执行前,父类的<clinit>()已经执行完毕
- 虚拟机必须保证一个类的 <clinit>() 方法在多线程下被同步加锁
IDEA 中安装 JClassLib Bytecode viewer 插件,可以很方便的看字节码。安装过程可以自行百度
举例1: 查看static定义后的代码就会出现clinit方法
public class ClassInitTest {
private static int num = 1;
static{
num = 2;
number = 20;
System.out.println(num);
//System.out.println(number);//报错:非法的前向引用。
}
/**
* 1、linking之prepare: number = 0 --> initial: 20 --> 10
* 2、这里因为静态代码块出现在声明变量语句前面,所以之前被准备阶段为0的number变量会
* 首先被初始化为20,再接着被初始化成10(这也是面试时常考的问题哦)
*
*/
private static int number = 10;
public static void main(String[] args) {
System.out.println(ClassInitTest.num);//2
System.out.println(ClassInitTest.number);//10
}
}
编译后的 clinit() 方法的字节码如下所示:
0 iconst_1 //num=1
1 putstatic #3 <com/atguigu/java/ClassInitTest.num>
4 iconst_2 //num=2
5 putstatic #3 <com/atguigu/java/ClassInitTest.num>
8 bipush 20 //先赋20
10 putstatic #5 <com/atguigu/java/ClassInitTest.number>
13 getstatic #2 <java/lang/System.out>
16 getstatic #3 <com/atguigu/java/ClassInitTest.num>
19 invokevirtual #4 <java/io/PrintStream.println>
22 bipush 10 //再赋10
24 putstatic #5 <com/atguigu/java/ClassInitTest.number>
27 return
举例2:观察有无 static() 函数
对 clinit()
的影响
举例3:虚拟机必须保证一个类的 <clinit>()
方法在多线程下被同步加锁。
public class DeadThreadTest {
public static void main(String[] args) {
Runnable r = () -> {
System.out.println(Thread.currentThread().getName() + "开始");
DeadThread dead = new DeadThread();
System.out.println(Thread.currentThread().getName() + "结束");
};
Thread t1 = new Thread(r,"线程1");
Thread t2 = new Thread(r,"线程2");
t1.start();
t2.start();
}
}
class DeadThread{
static{
if(true){
System.out.println(Thread.currentThread().getName() + "初始化当前类");
while(true){
}
}
}
}
输出结果:
线程2开始
线程1开始
线程2初始化当前类
/然后程序卡死了
程序卡死,分析原因:
- 两个线程同时去加载 DeadThread 类,而 DeadThread 类中静态代码块中有一处死循环
- 先加载 DeadThread 类的线程抢到了同步锁,然后在类的静态代码块中执行死循环,而另一个线程在等待同步锁的释放
- 所以无论哪个线程先执行 DeadThread 类的加载,另外一个类也不会继续执行。(一个类只会被加载一次)
类加载器分类
概述
- JVM 严格来讲支持两种类型的类加载器 。分别为
引导类加载器(Bootstrap ClassLoader)
和自定义类加载器(User-Defined ClassLoader)
- 从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是Java虚拟机规范却没有这么定义,而是 将所有派生于抽象类 ClassLoader 的类加载器都划分为自定义类加载器。
- 无论类加载器的类型如何划分,在程序中我们最常见的类加载器始终只有3个(Bootstrap Loader, ExtClassLoader, AppClassLoader),如下所示:
public class ClassLoaderTest {
public static void main(String[] args) {
//获取系统类加载器
ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
System.out.println(systemClassLoader);//sun.misc.Launcher$AppClassLoader@18b4aac2
//获取其上层:扩展类加载器,这里的getParent是重写过的,不是用于找父类,而是找上层加载器
ClassLoader extClassLoader = systemClassLoader.getParent();
System.out.println(extClassLoader);//sun.misc.Launcher$ExtClassLoader@1540e19d
//获取其上层:获取不到引导类加载器
ClassLoader bootstrapClassLoader = extClassLoader.getParent();
System.out.println(bootstrapClassLoader);//null
//对于用户自定义类来说:默认使用系统类加载器进行加载
ClassLoader classLoader = ClassLoaderTest.class.getClassLoader();
System.out.println(classLoader);//sun.misc.Launcher$AppClassLoader@18b4aac2
//String类使用引导类加载器进行加载的。---> Java的核心类库都是使用引导类加载器进行加载的。
ClassLoader classLoader1 = String.class.getClassLoader();
System.out.println(classLoader1);//null
}
}
- JDK 中的原话:虚拟机的内置类加载器,称为“引导类加载器”,它本身没有父类,但可以作为 ClassLoader 实例的父级。
- 我们尝试获取引导类加载器,获取到的值为 null ,这并不代表引导类加载器不存在,因为引导类加载器右 C/C++ 语言,我们获取不到
- 两次获取系统类加载器的值都相同: sun.misc.Launcher$AppClassLoader@18b4aac2 ,这说明系统类加载器是全局唯一的。
虚拟机自带的加载器
启动类加载器(引导类加载器,Bootstrap ClassLoader):
- 这个类加载使用C/C++语言实现的,嵌套在JVM内部
- 它用来加载Java的核心库(JAVA_HOME/jre/lib/rt.jar、resources.jar或sun.boot.class.path路径下的内容),用于提供JVM自身需要的类
- 并不继承自 java.lang.ClassLoader,没有父加载器。
- 加载 扩展类和应用程序类 的加载器,并作为他们的父类加载器
出于安全考虑,Bootstrap 启动类加载器只加载包名为 java、javax、sun等开头的类
。
扩展类加载器(Extension ClassLoader)
- Java语言编写,由
sun.misc.Launcher$ExtClassLoader
实现,派生于ClassLoader类。 - 父类加载器为启动类加载器
- 从 java.ext.dirs 系统属性所指定的目录中加载类库,或从JDK的安装目录的 `\jre/lib/ext子目录(扩展目录)下加载类库。如果用户创建的JAR放在此目录下,也会自动由扩展类加载器加载.
系统类加载器(也称为应用程序类加载器,AppClassLoader)
- Java语言编写,由
sun.misc.LaunchersAppClassLoader
实现
派生于ClassLoader类 - 父类加载器为扩展类加载器
- 它负责加载环境变量classpath或系统属性java.class.path指定路径下的类库
- 该类加载是程序中默认的类加载器,一般来说,Java应用的类都是由它来完成加载
- 通过classLoader.getSystemclassLoader()方法可以获取到该类加载器
举例:
public class ClassLoaderTest1 {
public static void main(String[] args) {
System.out.println("**********启动类加载器**************");
//获取BootstrapClassLoader能够加载的api的路径
URL[] urLs = sun.misc.Launcher.getBootstrapClassPath().getURLs();
for (URL element : urLs) {
System.out.println(element.toExternalForm());
}
//从上面的路径中随意选择一个类,来看看他的类加载器是什么:引导类加载器
ClassLoader classLoader = Provider.class.getClassLoader();
System.out.println(classLoader);
System.out.println("***********扩展类加载器*************");
String extDirs = System.getProperty("java.ext.dirs");
for (String path : extDirs.split(";")) {
System.out.println(path);
}
//从上面的路径中随意选择一个类,来看看他的类加载器是什么:扩展类加载器
ClassLoader classLoader1 = CurveDB.class.getClassLoader();
System.out.println(classLoader1);//sun.misc.Launcher$ExtClassLoader@1540e19d
}
}
结果:
********** 启动类加载器************** file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/lib/resources.jar
file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/lib/rt.jar
file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/lib/sunrsasign.jar
file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/lib/jsse.jar
file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/lib/jce.jar
file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/lib/charsets.jar
file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/lib/jfr.jar
file:/C:/Program%20Files/Java/jdk1.8.0_131/jre/classes null
*********** 扩展类加载器*************
C:\Program Files\Java\jdk1.8.0_131\jre\lib\ext C:\Windows\Sun\Java\lib\ext
sun.misc.Launcher$ExtClassLoader@29453f44
用户自定义类加载器(会在中篇进行详细的讲解)
使用场景
- 隔离加载类(比如说我假设现在 Spring框架,和 RocketMQ有包名路径完全一样的类,类名也一样,这个时候类就冲突了。不过一般的主流框架和中间件都会自定义类加载器,实现不同的框架,中间价之间是隔离的)
- 修改类加载的方式(除了 bootstrap 必须加载外,其他可以根据需求修改自己的加载器)
- 扩展加载源(还可以考虑从数据库中加载类,路由器等等不同的地方)
- 防止源码泄漏(对字节码文件进行解密,自己用的时候通过自定义类加载器来对其进行解密)
实现步骤
- 开发人员可以通过继承抽象类java.lang.ClassLoader类的方式,实现自己的类加载器,以满足一些特殊的需求
- 在JDK1.2之前,在自定义类加载器时,总会去继承ClassLoader类并重写
loadClass()方法
,从而实现自定义的类加载类,但是在JDK1.2之后已不再建议用户去覆盖loadClass()方法,而是建议把自定义的类加载逻辑写在findclass()
方法中。 - 在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承URIClassLoader类(ClassLoader的子类),这样就可以避免自己去编写findclass()方法及其获取字节码流的方式,使自定义类加载器编写更加简洁。
举例1:
public class CustomClassLoader extends ClassLoader {
@Override
protected Class<?> findClass(String name) throws ClassNotFoundException {
try {
//读物文件获得二进制数组
byte[] result = getClassFromCustomPath(name);
if (result == null) {
throw new FileNotFoundException();
} else {
//defineClass和findClass搭配使用
return defineClass(name, result, 0, result.length);
}
} catch (FileNotFoundException e) {
e.printStackTrace();
}
throw new ClassNotFoundException(name);
}
//自定义流的获取方式
private byte[] getClassFromCustomPath(String name) {
//从自定义路径中加载指定类:细节略
//如果指定路径的字节码文件进行了加密,则需要在此方法中进行解密操作。
return null;
}
public static void main(String[] args) {
CustomClassLoader customClassLoader = new CustomClassLoader();
try {
Class<?> clazz = Class.forName("One", true, customClassLoader);
Object obj = clazz.newInstance();
System.out.println(obj.getClass().getClassLoader());
} catch (Exception e) {
e.printStackTrace();
}
}
}
关于ClassLoader
lassLoader 类介绍
ClassLoader类,它是一个抽象类,其后所有的类加载器都继承自ClassLoader(不包括启动类加载器)
sun.misc.Launcher 它是一个java虚拟机的入口应用
获取ClassLoader途径
public class ClassLoaderTest2 {
public static void main(String[] args) {
try {
//1.
ClassLoader classLoader = Class.forName("java.lang.String").getClassLoader();
System.out.println(classLoader);
//2.
ClassLoader classLoader1 = Thread.currentThread().getContextClassLoader();
System.out.println(classLoader1);
//3.
ClassLoader classLoader2 = ClassLoader.getSystemClassLoader().getParent();
System.out.println(classLoader2);
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
}
}
结果为:
null
sun.misc.Launcher $ AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@1540e19d
第一个结果为空的原因是该类加载器名是由C写的,所以无法显示。
双亲委派机制
双亲委派原理
- Java虚拟机对class文件采用的是按需加载的方式,也就是说当需要使用该类时才会将它的class文件加载到内存生成class对象。而且加载某个类的class文件时,Java虚拟机采用的是双亲委派模式,即把请求交由父类处理,它是一种任务委派模式
- 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行; 如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器;
- 如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式。
- 父类加载器一层一层往下分配任务,如果子类加载器能加载,则加载此类,如果将加载任务分配至系统类加载器也无法加载此类,则抛出异常。
代码演示
举例1:
-
我们自己建立一个 java.lang.String 类,写上 static 代码块。
public class String { // static{ System.out.println("我是自定义的String类的静态代码块"); } }
-
在另外的程序中加载 String 类,看看加载的 String 类是 JDK 自带的 String 类,还是我们自己编写的 String 类:
public class StringTest { public static void main(String[] args) { java.lang.String str = new java.lang.String(); System.out.println("hello,atguigu.com"); StringTest test = new StringTest(); System.out.println(test.getClass().getClassLoader()); } }
输出结果:
hello,atguigu.com sun.misc.
Launcher$AppClassLoader@18b4aac2
- 第一个输出:由于双亲委派机制,所有需求先向上委托,如果最上面不行,再依次向下传播。首先new.java.String 引导类加载器发现自己可以做,因此直接返回 java.lang.String(JDK包里面的)。因此不会调用自定义的String中的print。
- 第二个输出:第二个定义的是StringTest(com.mytest包下)类,然后引导加载器发现自己不能做,下传给扩展类加载器,扩展加载器也不管。最后下传到系统加载器,系统加载器可以用,因此加载StringTest然后输出结果。
举例2
package java.lang;
public class String {
//
static{
System.out.println("我是自定义的String类的静态代码块");
}
//错误: 在类 java.lang.String 中找不到 main 方法
public static void main(String[] args) {
System.out.println("hello,String");
}
}
如上代码所示,我们直接自定义了一个 java.lang.String 的代码,然后在里面加入了main函数。结果如下:
如上图所说,在加载时,委托给引导类加载器加载,引导类加载器发现是 java 开头,就去调用JDK中的String类,然后发现JDK中的String类没有 main 方法,因此报错
、
举例3:
package java.lang;
public class ShkStart {
public static void main(String[] args) {
System.out.println("hello!");
}
}
输出结果:
java.lang.SecurityException: Prohibited package name: java.lang
at java.lang.ClassLoader.preDefineClass(ClassLoader.java:662)
at java.lang.ClassLoader.defineClass(ClassLoader.java:761)
at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
at java.net.URLClassLoader.defineClass(URLClassLoader.java:467)
at java.net.URLClassLoader.access$100(URLClassLoader.java:73)
at java.net.URLClassLoader$1.run(URLClassLoader.java:368)
at java.net.URLClassLoader$1.run(URLClassLoader.java:362)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:361)
at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:335)
at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
at sun.launcher.LauncherHelper.checkAndLoadMain(LauncherHelper.java:495)
Error: A JNI error has occurred, please check your installation and try again
Exception in thread "main"
Process finished with exit code 1
即使类名没有重复,也禁止使用java.lang这种包名。这是一种保护机制。
举例4
- 当我们加载jdbc.jar 用于实现数据库连接的时候,我们现在程序中需要用到SPI接口,而SPI接口属于rt.jar包中Java核心api。 然后使用双清委派机制,引导类加载器把rt.jar包加载进来,而rt.jar包中的SPI存在一些接口,接口我们就需要具体的实现类了。
- 具体的实现类就涉及到了某些第三方的jar包了,比如我们加载SPI的实现类jdbc.jar包【首先我们需要知道的是 jdbc.jar是基于SPI接口进行实现的】
- 第三方的jar包中的类属于系统类加载器来加载
- 从这里面就可以看到SPI核心接口由引导类加载器来加载,SPI具体实现类由系统类加载器来加载
双亲委派机制优势
通过上面的例子,我们可以知道,双亲机制可以
- 避免类的重复加载
- 保护程序安全,防止核心API被随意篡改
- 自定义类:自定义java.lang.String 没有被加载。
- 自定义类:java.lang.ShkStart(报错:阻止创建 java.lang开头的类)
沙箱安全机制
- 自定义String类时:在加载自定义String类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载jdk自带的文件(rt.jar包中java.lang.String.class),报错信息说没有main方法,就是因为加载的是rt.jar包中的String类。
- 这样可以保证对java核心源代码的保护,这就是沙箱安全机制。
其他
如何判断两个class对象是否相同
在JVM中表示两个class对象是否为同一个类存在两个必要条件:
- 类的完整类名必须一致,包括包名
- 加载这个类的ClassLoader(指ClassLoader实例对象)必须相同。换句话说,在JVM中,即使这两个类对象(class对象)来源同一个Class文件,被同一个虚拟机所加载,但只要加载它们的ClassLoader实例对象不同,那么这两个类对象也是不相等的
对类加载器的引用
- JVM必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的
- 如果一个类型是由用户类加载器加载的,那么JVM会将这个类加载器的一个引用作为类型信息的一部分保存在方法区中
- 当解析一个类型到另一个类型的引用的时候,JVM需要保证这两个类型的类加载器是相同的(后面讲