java虚拟机基础(二)

1. 什么是类的加载?

先来看看,类的加载机制在整个java程序运行期间处于一个什么环节,下面使用一张图来表示:
在这里插入图片描述
从上图可以看,java文件通过编译器变成了.class文件,接下来类加载器又将这些.class文件加载到JVM中。其中类装载器的作用其实就是类的加载。再来看类的加载的概念:

其实可以一句话来解释:类的加载指的是将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法区内,然后在堆区创建一个 java.lang.Class对象,用来封装类在方法区内的数据结构

2.在什么时候才会启动类加载器?

其实,类加载器并不需要等到某个类被“首次主动使用”时再加载它,JVM规范允许类加载器在预料某个类将要被使用时就预先加载它,如果在预先加载的过程中遇到了.class文件缺失或存在错误,类加载器必须在程序首次主动使用该类时才报告错误(LinkageError错误)如果这个类一直没有被程序主动使用,那么类加载器就不会报告错误。

3. 从哪个地方去加载.class文件

在这里进行一个简单的分类。例举了5个来源

(1)本地磁盘

(2)网上加载.class文件(Applet)

(3)从数据库中

(4)压缩文件中(ZAR,jar等)

(5)从其他文件生成的(JSP应用)

4.类加载的过程

类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载、验证、准备、解析、初始化、使用和卸载七个阶段。它们的顺序如下图所示:
在这里插入图片描述
其中类加载的过程包括了加载、验证、准备、解析、初始化五个阶段。在这五个阶段中,加载、验证、准备和初始化这四个阶段发生的顺序是确定的,而解析阶段则不一定,它在某些情况下可以在初始化阶段之后开始。另外注意这里的几个阶段是按顺序开始,而不是按顺序进行或完成,因为这些阶段通常都是互相交叉地混合进行的,通常在一个阶段执行的过程中调用或激活另一个阶段。

(1)加载

”加载“是”类加载机制”的第一个过程,在加载阶段,虚拟机主要完成三件事:

(1)通过一个类的全限定名来获取其定义的二进制字节流

(2)将这个字节流所代表的的静态存储结构转化为方法区的运行时数据结构

(3)在堆中生成一个代表这个类的Class对象,作为方法区中这些数据的访问入口。

相对于类加载的其他阶段而言,加载阶段是可控性最强的阶段,因为程序员可以使用系统的类加载器加载,还可以使用自己的类加载器加载。我们在最后一部分会详细介绍这个类加载器。在这里我们只需要知道类加载器的作用就是上面虚拟机需要完成的三件事,仅此而已就好了。

(2)验证

验证的主要作用就是确保被加载的类的正确性。也是连接阶段的第一步。说白了也就是我们加载好的.class文件不能对我们的虚拟机有危害,所以先检测验证一下。他主要是完成四个阶段的验证:

  1. 文件格式的验证验证.class文件字节流是否符合class文件的格式的规范,并且能够被当前版本的虚拟机处理。这里面主要对魔数、主版本号、常量池等等的校验(魔数、主版本号都是.class文件里面包含的数据信息、在这里可以不用理解)。

  2. 元数据验证主要是对字节码描述的信息进行语义分析,以保证其描述的信息符合java语言规范的要求,比如说验证这个类是不是有父类,类中的字段方法是不是和父类冲突等等。

  3. 字节码验证:这是整个验证过程最复杂的阶段,主要是通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。在元数据验证阶段对数据类型做出验证后,这个阶段主要对类的方法做出分析,保证类的方法在运行时不会做出危害虚拟机安全的事。

  4. 符号引用验证:它是验证的最后一个阶段,发生在虚拟机将符号引用转化为直接引用的时候。主要是对类自身以外的信息进行校验。目的是确保解析动作能够完成。

对整个类加载机制而言,验证阶段是一个很重要但是非必需的阶段,如果我们的代码能够确保没有问题,那么我们就没有必要去验证,毕竟验证需要花费一定的的时间。当然我们可以使用-Xverfity:none来关闭大部分的验证。

(3)准备

**准备阶段主要为类变量分配内存并设置初始值。**这些内存都在方法区分配。在这个阶段我们只需要注意两点就好了,也就是类变量和初始值两个关键词:

  1. 类变量(static)会分配内存,但是实例变量不会,实例变量主要随着对象的实例化一块分配到java堆中
  2. 这里的初始值指的是数据类型默认值,而不是代码中被显示赋予的值。比如:
public static int value = 1;

通过准备阶段,value的被赋初始值0。赋值为1是在初始化阶段完成。

注意,在上面value是被static所修饰的准备阶段之后是0,但是如果同时被final和static修饰准备阶段之后就是1了。我们可以理解为static final在编译器就将结果放入调用它的类的常量池中了。

(4)解析

解析阶段主要是虚拟机将常量池中的符号引用转化为直接引用的过程。什么是符号引用和直接引用呢?

  • 符号引用:以一组符号来描述所引用的目标,可以是任何形式的字面量,只要是能无歧义的定位到目标就好,就好比在班级中,老师可以用张三来代表你,也可以用你的学号来代表你,但无论任何方式这些都只是一个代号(符号),这个代号指向你(符号引用)
  • 直接引用:直接引用是可以指向目标的指针、相对偏移量或者是一个能直接或间接定位到目标的句柄。和虚拟机实现的内存有关,不同的虚拟机直接引用一般不同。

解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行。在编译的时候一个每个java类都会被编译成一个class文件,但在编译的时候虚拟机并不知道所引用类的地址,多以符号引用来代替,而在这个解析阶段就是为了把这个符号引用转化成为真正的地址的阶段。

个人理解:在编译时,java类并不知道引用类的实际内存地址,因此只能使用符号引用来代替。比如org.simple.People类引用org.simple.Tool类,在编译时People类并不知道Tool类的实际内存地址,因此只能使用符号org.simple.Tool(假设)来表示Tool类的地址。而在类装载器装载People类时,此时可以通过虚拟机获取Tool类的实际内存地址,因此便可以既将符号org.simple.Tool解析替换为Tool类的实际内存地址,及直接引用地址。

(5)初始化

这是类加载机制的最后一步,在这个阶段,java程序代码才开始真正执行。我们知道,在准备阶段已经为类变量赋过一次值。在初始化阶端,程序员可以根据自己的需求来赋值了。一句话描述这个阶段就是执行类构造器< clinit >()方法的过程。

():在JVM第一次加载.class文件到内存时调用。

在初始化阶段,主要为类的静态变量赋予正确的初始值,JVM负责对类进行初始化,主要对类变量进行初始化。在Java中对类变量进行初始值设定有两种方式:

①声明类变量是指定初始值

②使用静态代码块为类变量指定初始值

JVM初始化步骤

1、假如这个类还没有被加载和连接,则程序先加载并连接该类

2、假如该类的直接父类还没有被初始化,则先初始化其直接父类

3、假如类中有初始化语句,则系统依次执行这些初始化语句

类初始化时机:只有当对类的主动使用的时候才会导致类的初始化,类的主动使用包括以下六种:

  • 创建类的实例,也就是new的方式
  • 访问某个类或接口的静态变量,或者对该静态变量赋值
  • 调用类的静态方法
  • 反射(如 Class.forName(“com.shengsiyuan.Test”))
  • 初始化某个类的子类,则其父类也会被初始化
  • Java虚拟机启动时被标明为启动类的类( JavaTest),直接使用 java.exe命令来运行某个主类

好了,到目前为止就是类加载机制的整个过程,但是还有一个重要的概念,那就是类加载器。在加载阶段其实我们提到过类加载器,说是在后面详细说,在这就好好地介绍一下类加载器。

5.类加载器

虚拟机设计团队把加载动作放到JVM外部实现,以便让应用程序决定如何获取所需的类。

5.1 Java语言系统自带有三个类加载器:

  • Bootstrap ClassLoader :最顶层的加载类,启动类加载器主要加载核心类库,也就是我们环境变量下面%JRE_HOME%\lib下的rt.jar、resources.jar、charsets.jar和class等。另外需要注意的是可以通过启动jvm时指定-Xboot classpath和路径来改变Bootstrap ClassLoader的加载目录。比如java -Xbootclasspath/a:path被指定的文件追加到默认的bootstrap路径中。我们可以打开我的电脑,在上面的目录下查看,看看这些jar包是不是存在于这个目录。
  • Extention ClassLoader :扩展的类加载器,加载目录%JRE_HOME%\lib\ext目录下的jar包和class文件。还可以加载-D java.ext.dirs选项指定的目录。
  • Appclass Loader:也称为SystemAppClass。系统类加载器
    加载当前应用的classpath的所有类。

我们看到java为我们提供了三个类加载器,应用程序都是由这三种类加载器互相配合进行加载的,如果有必要,我们还可以加入自定义的类加载器。这三种类加载器的加载顺序是什么呢?

Bootstrap ClassLoader > Extention ClassLoader > Appclass Loader

一张图来看一下他们的层次关系
在这里插入图片描述

5.2 类加载的三种方式

认识了这三种类加载器,接下来我们看看类加载的三种方式。

(1)静态加载(隐式加载),通过new关键字创建实例对象。通过命令行启动应用时由JVM初始化加载含有main()方法的主类。

(2)动态加载(显示加载),通过Class.forName()方法动态加载,会默认执行初始化块(static{}),但是Class.forName(name,initialize,loader)中的initialze可指定是否要执行初始化块。

(3)动态加载(显示加载),通过ClassLoader.loadClass()方法动态加载,不会执行初始化块。

5.3 双亲委派原则

他的工作流程是: 当一个类加载器收到类加载任务,会先交给其父类加载器去完成,因此最终加载任务都会传递到顶层的启动类加载器,只有当父类加载器无法完成加载任务时,才会尝试执行加载任务。

采用双亲委派的一个好处是比如加载位于rt.jar包中的java.lang.Object,不管是哪个加载器加载这个类,最终都是委托给顶层的启动类加载器进行加载,这样就保证了使用不同的类加载器最终得到的都是同样一个Object对象。

双亲委派原则归纳一下就是:

  • 可以避免重复加载,父类已经加载了,子类就不需要再次加载
  • 更加安全,很好的解决了各个类加载器的基础类的统一问题,如果不使用该种方式,那么用户可以随意定义类加载器来加载核心api,会带来相关隐患。

5.4 自定义类加载器

在这一部分第一小节中,我们提到了java系统为我们提供的三种类加载器,还给出了他们的层次关系图,最下面就是自定义类加载器,那么我们如何自己定义类加载器呢?这主要有两种方式

(1)遵守双亲委派模型:继承ClassLoader,重写findClass()方法。
(2)破坏双亲委派模型:继承ClassLoader,重写loadClass()方法。 通常我们推荐采用第一种方法自定义类加载器,最大程度上的遵守双亲委派模型。

我们看一下实现步骤:

(1)创建一个类继承ClassLoader抽象类

(2)重写findClass()方法

(3)在findClass()方法中调用defineClass()在这里插入图片描述
在这里插入图片描述

接下来我们就可以自己去加载类了,使用方法大体就是两行:
在这里插入图片描述

6.java内存模型

6.1 java内存模型简介

java内存模型也叫做JMM,但是这个模型可不是像java内存结构一样,是真实存在的。java内存模型是一个抽象出来的概念。意思是把一部分内存区域设计成所有线程共享的,一个线程对数据更改,其他线程就能立刻知道。这种设计的方法叫做内存模型。我们可以提前看一下:java内存模型长什么样。
在这里插入图片描述
这就是java内存模型,也就是多个线程共享同一份数据。现在不知道你理解java内存模型和java内存结构的区别了没有,我们可以这样来总结一下:
(1)java内存结构是解决java中的数据如何存放的问题。

(2)java内存模型是解决java中多个线程共享数据的问题。

6.2 为什么要有内存模型

在计算机发展的第一个阶段,程序是在CPU中运行,数据在主存中保存。随着技术的发展,CPU的速度越来越多高,但是主存的速度却没有提高太多,大量的存取操作就会相当耗时。

为了解决上面的问题,于是乎出现了缓存,里面存放了一些CPU经常使用的主存数据,缓存的速度和CPU差不多,当CPU查找数据的时候,首先从缓存中查找,没有的话再从主存中查找。写数据的时候,先写缓存的数据,然后再更新到主存中。这样一种机制使得速度提高很多。

随着技术的继续发展,在上面缓存的基础上出现了一级二级三级缓存,查找也是逐层的,第一级缓存没有就到第二层,就这样以此类推。这时候CPU也得到了快读发展,由之前的一个核变成了多核CPU(一个CPU变成了多部分)。这时候呢,之前只能同时跑一个线程,现在就能跑很多个线程了。而且从上面我们可以看到,每一个核都有相应的缓存区,但是主内存还是只有一个。当多线程执行程序的时候,立马出现了很多个问题:

问题一:缓存一致性问题
也就是说,每一个核都有自己的缓存区,但是这些缓存区保存的数据却不一样。
在这里插入图片描述

问题二:处理器优化和指令重排

这问题的意思是,既然CPU有这么多内核,肯定是想让资源得到充分利用,于是把我们写的程序拆分,对一些代码进行乱序处理,这就是处理器优化。而且,java虚拟机一看CPU的这个操作真的强,于是就模仿了一下,创建了即时编译器(JIT),这个编译器也会做指令重排的操作。很明显,我们的代码顺序被打乱,指令被重排,就可能不会按照我们的意愿去执行了。

问题三:软件问题

(1)原子性问题

原子性是指一个操作是不可中断的。即使是在多个线程一起执行的时候,一个操作一旦开始,就不会被其它线程干扰。

首先缓存一致性问题在程序中会带来原子性问题,原子性问题是什么意思呢?你首先就要先理解原子。在生物里面原子叫做不可再分的物质。在软件里面,原子叫做不可再分的程序操作。而原子性问题肯定就是打破了这个规则,也就是说在这个操作中又进行了拆分。

在缓存一致性问题中,两个CPU内核中a的数据不一致,也就是说两个CPU内核读取主存a的值是不一样的。那么对于a的更改这个操作肯定就不是原子性,在A更改的过程中,两个CPU内核同时进行了更改。

(2)可见性问题

可见性(Visibility):可见性是指当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。

上面在介绍原子性问题的时候说了,两个线程(CPU内核)访问同一个变量时,线程2修改了这个变量的值,但是线程1却没有看到其修改,所以读的仍然是旧数据。

(3)有序性

也就是程序没有按照指定的顺序去执行。

可见性问题和有序性问题就是由于处理器优化和执行重排造成的。

6.3 java内存模型

针对于这么多问题,于是java虚拟机提出了一个java内存模型。有效地解决了上面出现的这三个问题,java内存模型要满足这三个规则:

规则一:所有的数据都在主内存中。

规则二:每个线程都保留一份共享变量的副本。线程对变量的所有操作都必须在这个副本内存中进行,而不能直接读写主内存。

规则三:不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量的传递均需要自己的工作内存和主存之间进行数据同步进行。

java提供了什么东西来实现的这三个规则呢?

比如说synchronized关键字保证了原子性,volatile关键字保证了可见性。synchronized关键字和volatile关键字保证了有序性。当然还有很多的Lock机制,并发包里面等等都是为了解决这三个问题提出来的。

  • volatile的特殊规则保证了新值能立即同步到主内存,以及每使用前立即从内存刷新。Synchronized是保证同一时刻只能由一个线程操作数据。

  • volatile关键字只能用于变量而synchronized关键字可以修饰方法以及代码块

  • 多线程访问volatile关键字不会发生阻塞,而synchronized关键字可能会发生阻塞

  • volatile关键字能保证数据的可见性,但不能保证数据的原子性。synchronized关键字两者都能保证。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值