Java内存模型概述
Java运行在JVM上,通常说的Java内存模型是指在Java虚拟机上的内存分配模型。
Java虚拟机在执行Java程序时会把它管理的内存划分为几个不同的数据区域。这些区域有各自的用途以及创建、销毁时间,有的区域随着虚拟机进程的启动而存在,有的区域则随着用户线程的启动而建立,随着用户线程的结束而销毁。根据《Java虚拟机规范(Java SE 7版)》,Java虚拟机中存在的几块内存区域如下图:
其中线程私有的数据区有:
- 程序计数器
- 虚拟机栈
- 本地方法栈
线程共享的数据区有:
- 堆
- 方法区
运行时数据区域
程序计数器
程序计数器(Program Counter Register)是一块很小的内存区域,可以看做当前线程所执行的字节码的行号指示器。
那么为什么程序计数器需要线程私有呢?由于JVM的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个特定时刻,一个处理器或一个内核(如多核心处理器)都只会执行一条线程中的指令。因此,为了线程切换后能够恢复到上次执行的位置,每个线程就需要维护一个独立的程序计数器,这样各线程间就可以互不影响。
如果线程正在执行一个Java方法,那么该计数器记录的就是正在执行的虚拟机字节码指令的地址,如果正在执行的是一个Native方法,那么这个计数器的值则为空(Undefined)。
虚拟机栈
Java虚拟机栈也是线程私有的,因此它与线程的生命周期一致。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用来存储局部变量表、操作数栈、动态链接、方法出口等信息。当一个方法调用时,就对应着一个栈帧在虚拟机中入栈,当该方法执行完成时就对应着该栈帧在虚拟机中的出栈过程。
我们经常说的堆和栈,其中的“栈”就是指这里的虚拟机栈,或者指虚拟机栈中的局部变量表部分。局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用及ReturnAddress类型。
其中对象引用,即Reference类型,它不等同于对象本身,它可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置。ReturnAddress类型指向了一条字节码指令的地址。
局部变量表所需的空间在编译期间分配完成,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
本地方法栈
本地方法栈与虚拟机栈的作用类似,主要区别是虚拟机栈为Java方法服务,而本地方法栈则为虚拟机使用到的Native方法服务。有些虚拟机实现中,直接把虚拟机栈与本地方法栈合二为一,如Sun HotSpot虚拟机。
Java堆
对于多数应用来说,Java堆(Java Heap)是虚拟机所管理的内存分区中最大的一块,我们通常说的“堆”就是这块区域。Java堆是被所有线程共享的内存区域,因此在虚拟机启动时就被创建,此区域的唯一作用就是存放对象实例,几乎所有的对象实例都在这里分配内存。不过随着技术的发展,如JIT即时编译器的发展与逃逸分析技术的成熟,栈上分配、标量替换优化技术也可能导致并非所有对象都得在堆上分配,也可能在栈上临时分配对象。
Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。在实现时,既可以实现成固定大小的,也可以是可扩展的,当前主流的虚拟机都是按照可扩展来实现的,通过-Xmx和-Xms控制。
Java堆是垃圾收集的主要区域,因此也被称为“GC堆”。
从内存回收角度来看,由于垃圾收集器的分代收集算法,Java堆又可分为新生代和老年代,新生代又细分为Eden、From Survivor、To Survivor等区域,这样做的目的是为了更高效地进行内存回收。
从内存分配角度来看,Java堆可以划分为多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB),这样划分的目的是为了更快地分配内存。
方法区
方法区也是线程共享的内存区域,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
Java虚拟机规范对方法区的限制非常宽松,除了和Java堆一样不需要连续的内存和可以选择固定大小或可扩展外,还可以选择不实现垃圾收集。一般来说,方法区的垃圾回收效率及效果都难以让人满意,这个区域的内存回收主要是针对常量池的回收和对类型的卸载,条件相当苛刻,但这部分的内存回收确实是有必要的。
运行时常量池
运行时常量池(Runtime Constant Pool)是方法区的一部分。此区域用于存储编译期生成的各种字面量和符号引用。
运行时常量池相对于Class文件常量池(Constant Pool Table)的一个重要特性是具备动态性,即Java语言不要求常量一定要在编译期间产生,也就是并非预置入Class文件中常量池的内容才能进入方法区的运行时常量池,运行期间也可以将新的常量放入池中,如String类的intern()方法,当调用intern()时,发现某字符串常量在该常量池中不存在,这时才将该常量入池,然后返回其引用,这就是在运行期间入池的一个示例。
各数据区异常
程序计数器
此内存区域是唯一一个在Java虚拟机规范中没有规定任何异常情况的区域。
虚拟机栈
在此区域中,Java虚拟机规范定义了两种异常情况:
- StackOverflowError:当线程请求的栈深度大于虚拟机所允许的深度,将抛出此异常,如递归调用,这个很常见。
- OutOfMemoryError:当虚拟机动态扩展时(当前大部分虚拟机都支持动态扩展,也允许指定固定长度的虚拟机栈),如果无法申请到足够的内存,就会抛出此异常。
本地方法栈
跟虚拟机栈一样,本地方法栈也存在两种异常情况:
- StackOverflowError
- OutOfMemoryError
Java堆
Java虚拟机规范规定堆区域可发生以下异常:
- OutOfMemoryError:当堆中没有足够的内存来为实例分配,并且堆也无法扩展,此时就会报出该异常。
方法区
根据虚拟机规范,此区域有如下异常:
- OutOfMemoryError:当方法区无法满足内存分配需求时,将抛出此异常。
运行时常量池
由于常量池是方法区的一部分,其内存大小必然受到方法区的限制,因此当常量池无法再申请到足够内存时,也会抛出OutOfMemoryError异常。