Java核心技术——JVM架构

0. 前言

Java虚拟机(Java virtualmachine,JVM)是运行 Java程序必不可少的机制。JVM实现了Java语言最重要的特征:即平台无关性。

 

平台无关性原理:编译后的 Java程序指令并不直接在硬件系统的 CPU上执行,而是 JVM执行。JVM屏蔽了与具体平台相关的信息,使Java语言编译程序只需要生成在JVM上运行的目标字节码(javac是收录于 JDK 中的 Java语言编译器。该工具可以将后缀名为. java的源文件编译为后缀名为. class的可以运行于 Java虚拟机的字节码),就可以在多种平台上不加修改地运行。Java虚拟机在执行字节码时,把字节码解释成具体平台上的机器指令执行。因此实现Java平台无关性。它是 Java程序能在多平台间进行无缝移植的可靠保证,同时也是 Java程序的安全检验引擎(还进行安全检查)。


1. JVM结构图



JVM = 类加载器 classloader+ 执行引擎 executionengine + 运行时数据区域 runtime data area

如上图所示,首先 Java 源代码文件 (.java 后缀 ) 会被 Java 编译器编译为字节码文件 (.class 后缀 ) ,然后由 JVM 中的 类加载器 加载各个类的字节码文件,加载完毕之后,交由 JVM 执行引擎执行 。在整个程序执行过程中, JVM 会用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为 Runtime Data Area (运行时数据区),也就是我们常说的 JVM 内存

因此,Java中我们常常说到的内存管理就是针对这段空间进行管理(如何分配和回收内存空间)。


2. ClassLoader

classloader把硬盘上的class文件加载到JVM中的运行时数据区域,但是它不负责这个类文件能否执行,而这个是执行引擎负责的。

classloader有两种装载class的方式(时机):

(1)隐式:运行过程中,碰到new方式生成对象时,隐式调用classLoader到JVM。
(2)显式:通过class.forname()动态加载。


3.双亲委派模型(ParentDelegation Model

类的加载过程采用双亲委托机制,这种机制能更好的保证 Java平台的安全

该模型要求除了顶层的Bootstrap classloader启动类加载器外,其余的类加载器都应当有自己的父类加载器。子类加载器和父类加载器不是以继承(Inheritance)的关系来实现,而是通过组合(Composition)关系来复用父加载器的代码

每个类加载器都有自己的命名空间(由该加载器及所有父类加载器所加载的类组成),在同一个命名空间中,不会出现类的完整名字(包括类的包名)以及相同的两个类;在不同的命名空间中,有可能会出现类的完整名字。


双亲委派模型的工作过程为:

(1)当前 ClassLoader首先从自己已经加载的类中查询是否此类已经加载,如果已经加载则直接返回原来已经加载的类。(每个类加载器都有自己的加载缓存,当一个类被加载了以后就会放入缓存,等下次加载的时候就可以直接返回了。)

(2)当前 ClassLoader的缓存中没有找到被加载的类的时候,委托父类加载器去加载,父类加载器采用同样的策略,首先查看自己的缓存,然后委托父类的父类去加载,一直到 bootstrapClassLoader

(3)当所有的父类加载器都没有加载的时候,再由当前的类加载器加载,并将其放入它自己的缓存中,以便下次有加载请求的时候直接返回。

 

使用这种模型来组织类加载器之间的关系的好处:

(1)主要是为了安全性,避免用户自己编写的类动态替换 Java的一些核心类,比如 String。

(2)同时也避免了重复加载,因为 JVM中区分不同类,不仅仅是根据类名,相同的 class文件被不同的 ClassLoader加载就是不同的两个类,如果相互转型的话会抛java.lang.ClassCaseException。

类加载器 ClassLoader是具有层次结构的,也就是父子关系。其中,Bootstrap是所有类加载器的父亲

结构如下图所示:


Bootstrapclass loader 父类

当运行Java虚拟机时,这个类加载器被创建,它负责加载虚拟机的核心类库,如java.lang.*等。例如java.lang.Object就是由根类加载器加载的。需要注意的是,这个类加载器不是用Java语言写的,而是用 C/C++写的。

Extensionclass loader这个加载器加载除了基本 API之外的一些拓展类

AppClassLoader加载应用程序和程序员自定义的类

除了以上虚拟机自带的加载器以外,用户还可以定制自己的类加载器(User-definedClass Loader)。

Java提供了抽象类java.lang.ClassLoader,所有用户自定义的类加载器应该继承ClassLoader


4. 执行引擎 

作用:执行字节码,或者执行本地方法。


5. Runtime DataArea

JVM运行时数据区 (JVM RuntimeArea)其实就是指 JVM运行期间,其对JVM内存空间的划分和分配JVM在运行时将数据划分为了以下几个区域来存储

程序员写的所有程序都被加载到运行时数据区域中。

(图注:JDK1.7已经把常量池转移到堆里面了!

PC寄存器(The pc Register

(1)每一个Java线程都有一个PC寄存器,用以记录当前执行到哪个指令

(2)PC寄存器是用于存储每个线程下一步将执行的JVM指令,如该方法是Java方法,则记录的是正在执行的虚拟机字节码地址,如该方法为native的,则计数器值为空

(3)此内存区域是唯一一个在JVM中没有规定任何OutOfMemoryError情况的区域。


JVM栈(Java Virtual MachineStacks

(1)JVM栈是线程私有的,每个线程创建的同时都会创建JVM栈,与程PC寄存器一样,JVM栈的生命周期也是与线程相同。

(2)本质上来讲,它就是个栈。里面存放的元素叫栈帧,栈帧好像很复杂的样子,其实它很简单!它里面具体存放的是执行的函数的一些数据,无非就是局部变量表(保存函数内部的变量)、操作数栈(执行引擎计算时需要),方法出口等等。

执行引擎每调用一个函数时,就为这个函数创建一个栈帧,并加入虚拟机栈。换个角度理解,每个函数从调用到执行结束,其实是对应一个栈帧的入栈和出栈

(3)这个区域可能有两种异常:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常(如:将一个函数反复递归自己,最终会出现这种异常)。如果JVM栈可以动态扩展(大部分JVM是可以的),当扩展时无法申请到足够内存则抛出OutOfMemoryError异常。

(4)由于JVM栈是线程私有的,因此其在内存分配上非常高效,并且当线程运行完毕后,这些内存也就被自动回收


本地方法栈(Native Method Stacks

(1)本地方法栈与虚拟机栈所发挥的作用很相似,他们的区别在于虚拟机栈为执行Java代码方法服务,而本地方法栈是为Native方法服务。

(2)和JVM栈一样,这个区域也会抛出StackOverflowError和OutOfMemoryError异常。


方法区(Method Area

(1)在方法区中,存储了每个类的信息(包括类的名称、方法信息、字段信息)、静态变量常量等。如,当程序中通过getName、isInterface等方法来获取信息时,这些数据都来源于方法区域

(2)方法区域是全局共享的,比如每个线程度可以访问同一个类的静态变量对象。

(3)由于使用反射机制的原因,虚拟机很难推测哪个类信息不再使用,因此这块区域的回收很难!另外,对这块区域主要是针对常量池回收,值得注意的是JDK1.7已经把常量池转移到堆里面了。

(4)同样,当方法区无法满足内存分配需求时,会抛出OutOfMemoryError。下面演示一下造成方法区内的OOM场景。

执行之前,可以把虚拟机的参数-XXpermSize和-XX:MaxPermSize限制方法区大小。

[java]  view plain  copy
  1. //不断将字符串添加到常量池,最终导致内存不足抛出方法区的OOM  
  2. List<String> list =new ArrayList<String>();  
  3. int i =0;  
  4. while(true){  
  5.     list.add(String.valueOf(i).intern());  
  6. }  

String的intern函数的作用就不多赘述了,在我这篇博文Java技术——你真的了解String类的intern()方法吗有所介绍。关于JDK1.6和JDK1.7之后常量池位置的变化对该函数的影响,也在链接文中阐述了。


运行时常量池(Runtime Constant Pool

(1)存放类中固定的常量信息、方法和Field的引用信息等,其空间从方法区域(JDK1.7后为堆空间)中分配。

(2)Class文件中除了有类的版本、字段、方法、接口等描述等信息外,还有一项信息是常量表(constant_pool table),用于存放编译期已可知的常量,这部分内容将在类加载后进入方法区(永久代)存放。但是Java语言并不要求常量一定只有编译期预置入Class的常量表的内容才能进入方法区常量池,运行期间也可将新内容放入常量池(最典型的String.intern()方法)。

(3)当常量池无法在申请到内存时会抛出OutOfMemoryError异常,上面也分析过了。


Java

(1)Java堆(java heap)是JVM所管理的最大的一块内存。它是被所有线程共享的一块内存区域,在虚拟机启动时创建。

(2)几乎所有的实例对象都是在这块区域中存放。(JIT编译器貌似不是这样的)。

(3)Java堆是垃圾收集管理的主要战场。所有Java堆可以细分为:新生代和老年代。再细致分就是把新生代分为:Eden空间、FromSurvivor空间、To Survivor空间。JVM具体的垃圾回收机制总结请查看我的另外一篇Java核心技术——内存管理和垃圾回收

(4)根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值