0. 前言
Java虚拟机(Java virtualmachine,JVM)是运行 Java程序必不可少的机制。JVM实现了Java语言最重要的特征:即平台无关性。
平台无关性原理:编译后的 Java程序指令并不直接在硬件系统的 CPU上执行,而是由 JVM执行。JVM屏蔽了与具体平台相关的信息,使Java语言编译程序只需要生成在JVM上运行的目标字节码(javac是收录于 JDK 中的 Java语言编译器。该工具可以将后缀名为. java的源文件编译为后缀名为. class的可以运行于 Java虚拟机的字节码),就可以在多种平台上不加修改地运行。Java虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。因此实现Java平台无关性。它是 Java程序能在多平台间进行无缝移植的可靠保证,同时也是 Java程序的安全检验引擎(还进行安全检查)。
1. JVM结构图
JVM = 类加载器 classloader+ 执行引擎 executionengine + 运行时数据区域 runtime data area
如上图所示,首先 Java 源代码文件 (.java 后缀 ) 会被 Java 编译器编译为字节码文件 (.class 后缀 ) ,然后由 JVM 中的 类加载器 加载各个类的字节码文件,加载完毕之后,交由 JVM 执行引擎执行 。在整个程序执行过程中, JVM 会用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为 Runtime Data Area (运行时数据区),也就是我们常说的 JVM 内存 。
因此,在Java中我们常常说到的内存管理就是针对这段空间进行管理(如何分配和回收内存空间)。
2. ClassLoader
classloader把硬盘上的class文件加载到JVM中的运行时数据区域,但是它不负责这个类文件能否执行,而这个是执行引擎负责的。
classloader有两种装载class的方式(时机):
(1)隐式:运行过程中,碰到new方式生成对象时,隐式调用classLoader到JVM。
(2)显式:通过class.forname()动态加载。
3.双亲委派模型(ParentDelegation Model)
类的加载过程采用双亲委托机制,这种机制能更好的保证 Java平台的安全。
该模型要求除了顶层的Bootstrap classloader启动类加载器外,其余的类加载器都应当有自己的父类加载器。子类加载器和父类加载器不是以继承(Inheritance)的关系来实现,而是通过组合(Composition)关系来复用父加载器的代码。
每个类加载器都有自己的命名空间(由该加载器及所有父类加载器所加载的类组成),在同一个命名空间中,不会出现类的完整名字(包括类的包名)以及相同的两个类;在不同的命名空间中,有可能会出现类的完整名字。
双亲委派模型的工作过程为:
(1)当前 ClassLoader首先从自己已经加载的类中查询是否此类已经加载,如果已经加载则直接返回原来已经加载的类。(每个类加载器都有自己的加载缓存,当一个类被加载了以后就会放入缓存,等下次加载的时候就可以直接返回了。)
(2)当前 ClassLoader的缓存中没有找到被加载的类的时候,委托父类加载器去加载,父类加载器采用同样的策略,首先查看自己的缓存,然后委托父类的父类去加载,一直到 bootstrapClassLoader。
(3)当所有的父类加载器都没有加载的时候,再由当前的类加载器加载,并将其放入它自己的缓存中,以便下次有加载请求的时候直接返回。
使用这种模型来组织类加载器之间的关系的好处:
(1)主要是为了安全性,避免用户自己编写的类动态替换 Java的一些核心类,比如 String。
(2)同时也避免了重复加载,因为 JVM中区分不同类,不仅仅是根据类名,相同的 class文件被不同的 ClassLoader加载就是不同的两个类,如果相互转型的话会抛java.lang.ClassCaseException。
类加载器 ClassLoader是具有层次结构的,也就是父子关系。其中,Bootstrap是所有类加载器的父亲。
结构如下图所示:
Bootstrapclass loader: 父类
当运行Java虚拟机时,这个类加载器被创建,它负责加载虚拟机的核心类库,如java.lang.*等。例如java.lang.Object就是由根类加载器加载的。需要注意的是,这个类加载器不是用Java语言写的,而是用 C/C++写的。
Extensionclass loader:这个加载器加载除了基本 API之外的一些拓展类。
AppClassLoader:加载应用程序和程序员自定义的类。
除了以上虚拟机自带的加载器以外,用户还可以定制自己的类加载器(User-definedClass Loader)。
Java提供了抽象类java.lang.ClassLoader,所有用户自定义的类加载器应该继承ClassLoader类。
4. 执行引擎
作用:执行字节码,或者执行本地方法。
5. Runtime DataArea
JVM运行时数据区 (JVM RuntimeArea)其实就是指 JVM在运行期间,其对JVM内存空间的划分和分配。JVM在运行时将数据划分为了以下几个区域来存储。
程序员写的所有程序都被加载到运行时数据区域中。
(图注:JDK1.7已经把常量池转移到堆里面了!)
PC寄存器(The pc Register)
(1)每一个Java线程都有一个PC寄存器,用以记录当前执行到哪个指令。
(2)PC寄存器是用于存储每个线程下一步将执行的JVM指令,如该方法是Java方法,则记录的是正在执行的虚拟机字节码地址,如该方法为native的,则计数器值为空。
(3)此内存区域是唯一一个在JVM中没有规定任何OutOfMemoryError情况的区域。
JVM栈(Java Virtual MachineStacks)
(1)JVM栈是线程私有的,每个线程创建的同时都会创建JVM栈,与程PC寄存器一样,JVM栈的生命周期也是与线程相同。
(2)本质上来讲,它就是个栈。里面存放的元素叫栈帧,栈帧好像很复杂的样子,其实它很简单!它里面具体存放的是执行的函数的一些数据,无非就是局部变量表(保存函数内部的变量)、操作数栈(执行引擎计算时需要),方法出口等等。
执行引擎每调用一个函数时,就为这个函数创建一个栈帧,并加入虚拟机栈。换个角度理解,每个函数从调用到执行结束,其实是对应一个栈帧的入栈和出栈。
(3)这个区域可能有两种异常:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常(如:将一个函数反复递归自己,最终会出现这种异常)。如果JVM栈可以动态扩展(大部分JVM是可以的),当扩展时无法申请到足够内存则抛出OutOfMemoryError异常。
(4)由于JVM栈是线程私有的,因此其在内存分配上非常高效,并且当线程运行完毕后,这些内存也就被自动回收。
本地方法栈(Native Method Stacks)
(1)本地方法栈与虚拟机栈所发挥的作用很相似,他们的区别在于虚拟机栈为执行Java代码方法服务,而本地方法栈是为Native方法服务。
(2)和JVM栈一样,这个区域也会抛出StackOverflowError和OutOfMemoryError异常。
方法区(Method Area)
(1)在方法区中,存储了每个类的信息(包括类的名称、方法信息、字段信息)、静态变量、常量等。如,当程序中通过getName、isInterface等方法来获取信息时,这些数据都来源于方法区域。
(2)方法区域是全局共享的,比如每个线程度可以访问同一个类的静态变量对象。
(3)由于使用反射机制的原因,虚拟机很难推测哪个类信息不再使用,因此这块区域的回收很难!另外,对这块区域主要是针对常量池回收,值得注意的是JDK1.7已经把常量池转移到堆里面了。
(4)同样,当方法区无法满足内存分配需求时,会抛出OutOfMemoryError。下面演示一下造成方法区内的OOM场景。
执行之前,可以把虚拟机的参数-XXpermSize和-XX:MaxPermSize限制方法区大小。
String的intern函数的作用就不多赘述了,在我这篇博文Java技术——你真的了解String类的intern()方法吗有所介绍。关于JDK1.6和JDK1.7之后常量池位置的变化对该函数的影响,也在链接文中阐述了。
运行时常量池(Runtime Constant Pool)
(1)存放类中固定的常量信息、方法和Field的引用信息等,其空间从方法区域(JDK1.7后为堆空间)中分配。
(2)Class文件中除了有类的版本、字段、方法、接口等描述等信息外,还有一项信息是常量表(constant_pool table),用于存放编译期已可知的常量,这部分内容将在类加载后进入方法区(永久代)存放。但是Java语言并不要求常量一定只有编译期预置入Class的常量表的内容才能进入方法区常量池,运行期间也可将新内容放入常量池(最典型的String.intern()方法)。
(3)当常量池无法在申请到内存时会抛出OutOfMemoryError异常,上面也分析过了。
Java堆
(1)Java堆(java heap)是JVM所管理的最大的一块内存。它是被所有线程共享的一块内存区域,在虚拟机启动时创建。
(2)几乎所有的实例对象都是在这块区域中存放。(JIT编译器貌似不是这样的)。
(3)Java堆是垃圾收集管理的主要战场。所有Java堆可以细分为:新生代和老年代。再细致分就是把新生代分为:Eden空间、FromSurvivor空间、To Survivor空间。JVM具体的垃圾回收机制总结请查看我的另外一篇Java核心技术——内存管理和垃圾回收。
(4)根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。