引
JAVA虚拟机在执行JAVA程序的时候,会把它所管理的内存区域划分成若干个不同的数据区域。每个区域都有各自的功能,也有各自的创建和销毁时间,有的区域可能随着虚拟机的进程的启动而存在,有的区域可能根据用户线程的启动和结束来创建及销毁。
根据《Java虚拟机规范(JavaSE 7版)》的规定,Java虚拟机所管理的内存会被划分成以下几个运行时数据区域
下面将详细讲述各个数据区的作用
程序计数器(Program Counter Register):
程序计数器是一块比较小的内存区域,可以把它看成当前线程正在执行的字节码的行号指示器,虚拟机在解释字节码的时候,就是根据这个玩意来知道下一条需要执行的字节码在哪里(并非一定一行一行执行,如果遇到类似汇编中的jmp指令,可能会跳转到非下一行的指令),分支、跳转、循环、异常处理、线程恢复(比如被notify唤醒的线程)等基础功能都需要依赖于这个计数器。
Java虚拟机的多线程,它通过多个线程切换并分配CPU执行时间(CPU时间片)来实现多线程。也就是说,在一个瞬间(某一个确定的时刻),一个处理器(对于多核处理器来说,是指一个核心处理器)都只会执行一条线程中的指令。因此,在线程恢复后,为了能让该线程可以知道已经执行到哪一条指令,所以每一个线程都会有一个独立的程序计数器,独立工作,独立存储,互不影响,我们把这样每一个线程都会有的独立区域叫做“线程私有”的内存。
如果当前线程在执行一个Java方法,那这个计数器中记录的就是正在执行的字节码的指令的地址,如果正在执行的是一个本地方法(Native),这个计数器则为空(Undefined)。这个内存区域是在Java虚拟机规范中唯一一块没有规定OutOfMemoryError情况的区域。
Java虚拟机栈(JVM Stack):
与程序计数器一样,Java虚拟机栈也是线程私有的,它的生命周期与线程一致。虚拟机栈描述的是Java方法执行时的内存模型:每一个方法在执行时,会创建一个栈帧(Stack Frame),用于存储局部变量表、操作数栈、动态链接、方法出口等信息。在Java中,每一个方法从调用到完成,就对应了一个栈帧从虚拟机栈中入栈并出栈的过程。
局部变量表存放了编译期可知的各种基本数据类型(8大基本数据类型)、对象的引用(reference类型,并不是对象本身,可能是一个指向对象起始地址的指针,也可能是指向一个对象的句柄或者其他与此对象有关的位置)和returnAddress类型(指向了一条字节码指令的地址)。
局部变量表中的数据,除了64位的long和doule会占用两个局部变量空间(Slot),其余数据类型只占用一个局部变量空间(包括引用类型、returnAddress类型)。正因为每一个类型所占的空间都是可以确定的,所以一个局部变量表所需的内存空间在编译期间就可以完成分配,当进入到一个方法中时,这个方法需要在栈帧中分配多大的局部变量空间是可以完全确定的,方法运行期间不会修改局部变量表的大小。
在Java虚拟机规范中,对这个区域规定了两种异常情况:
- 如果当前线程请求的栈深度大于虚拟机允许的栈深度,将抛出StackOverflowError异常。
- 如果虚拟机栈可以动态扩展(现在大部分虚拟机都可以动态扩展,只不过虚拟机规范中也允许固定长度的虚拟机栈),如果扩展时无法申请到足够的内存,将抛出OutOfMemory异常。
本地方法栈(Native Method Stack):
本地方法栈与虚拟机栈所发挥的功能基本类似,他们之间的区别就是虚拟机栈为虚拟机执行Java方法(字节码)服务,而本地方法栈为虚拟机使用到的native方法服务。在虚拟机规范中,对于本地方法栈中的方法所使用的语言、使用的方式和数据结构并没有强制规定,所以具体的虚拟机可以自由的实现它。甚至有的虚拟机(例如Sun HotSpot虚拟机)直接就把虚拟机栈和本地方法栈合二为一。和虚拟机栈一样,本地方法栈也会抛出StackOverflowError和OutOfMemoryError。
Java堆(Java Heap):
对于绝大部分应用来说,Java堆是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块区域,在虚拟机启动的时候创建。这块内存区域的唯一目的就是为了存放对象的实例,几乎所有的对象实例都在这里分配内存。这一点在Java虚拟机规范中的描述是:所有的对象实例和数组都要在堆上分配。但是随着JIT编译器的发展与逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术将会导致一些微妙的变化,所有的对象都分配在堆上也渐渐变得不是那么“绝对”了。
Java堆是垃圾收集器管理的主要区域,因此很多时候也被称为“GC堆”(Garbage Collected Heap,嗯,垃圾堆)。从内存回收的角度来看,由于现在的垃圾收集器基本都采用分代收集的算法,所以Java堆还可以细分为:新生代和老年代。如果再细致一点,还可以分为:Eden空间、From Survivor空间、To Survivor空间等。从内存分配的角度来看,线程共享的Java堆还可以划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB)。不过,无论怎么划分,按什么角度划分,都与存放的内容无关,无论哪个区域,存放的依然是对象的实例,进一步划分的目的是为了更好的回收内存和更快的分配内存。
根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的就可以了。在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过 -Xmx 和 -Xms 控制)。如果在堆中没有内存可以完成实例,并且堆也无法再扩展的时候,将会抛出OutOfMemoryError异常。
方法区(Method Area):
方法区与Java堆一样,是各个线程共享的内存区域,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译的代码等数据。虽然Java虚拟机规范把方法区描述为Java堆的一个逻辑部分,但它有一个别名叫 Non-Heap(非堆),目的应该是和Java堆 区分开。
对于习惯在HotSpot虚拟机上开发、部署程序的开发者来说,很多人愿意把方法区称为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展到方法区,或者说使用永久代来实现方法区而已,这样HotSpot虚拟机就可以像管理Java堆一样管理这部分内存,能够省去专门为方法区编写内存管理代码的工作。对于其他虚拟机(例如 BEA JRockit、IBM J9等)来说是不存在永久代的概念的。原则上来说,如何实现方法区属于虚拟机的实现细节,不受虚拟机规范约束,但使用永久代来实现方法区,现在看来并不是一个好主意,因为这样更容易遇到内存溢出的问题(永久代有 -XX:MaxPermSize的上限,但是J9和Jrockit只要没有触碰到进程可用内存的上限,例如32位系统的4GB,就不会出现问题),而且有极少数方法(例如String.intern()手动入池)会因为这个原因导致不同虚拟机下有不同的表现。因此,对于HotSpot虚拟机,官方已经有放弃永久代逐步改用Native Memory来实现方法区的规划了,在JDK1.7的HotSpot中,已经把在永久代中的字符串常量池移出了。
Java虚拟机规范对方法区的限制非常宽松,除了和Java堆一样不需要连续的空间和可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。相对而言