目录
1. 运行时数据区域
a.程序计数器:线程私有的内存空间,可看作当前线程所执行的字节码的行号指示器。字节码解释器工作时就是通过改变计数器的值来选取下条需要执行的字节码指令,分支,循环,跳转,异常处理,线程恢复等功能都需要计数器来完成。各个线程之间计数器互不影响,独立存储。如果线程正在执行的是java方法,计数器记录的是正在执行的虚拟机字节码指令地址;如果执行的是native方法,则计数器值为空。
b.java虚拟机栈:线程私有空间,生命周期与线程相同。每个java方法在执行的同时都会创建一个栈帧用于存储局部变量表,操作数栈,动态链接,方法出口等信息。每一个方法的调用到执行完成过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。如果线程请求的栈深度大于虚拟机所允许的深度,则抛出StackOverflowError异常,如果虚拟机栈可以动态扩展,扩展时仍无法申请到足够的内存,就会抛出OutOfMemoryError异常。
局部变量表存放编译期可知的各种基本类型,对象引用和returnAddress类型(指向一条字节码指令地址)。其中64位长度的long和double类型数据占用2个局部变量空间(Slot),局部变量表所需内存空间在编译期完成分配。
c.本地方法栈:虚拟机栈执行java方法,本地方法栈执行Native方法。与虚拟机栈一样,会抛出异常。
d.java堆:是被所有线程共享的内存区域,在虚拟机启动时创建。此区域唯一功能是存放对象实例,几乎所有对象实例都在这里分配内存。java堆可以处于物理上不连续的内存空间,可以是固定大小,也可是可扩展的。如果堆没有内存完成实例分配并无法再扩展时,将会抛出OutOfMemoryError。
e.方法区:线程共享区域,存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。
f:运行时常量池:方法区的一部分。Class文件中除了有类的版本,字段,方法接口等描述信息外,还有一项信息是常量池,用于存放编译期生成的各种字面量和符号引用,这部分内容在类加载后进入方法区的运行时常量池存放。运行期间也可能将新的常量放入池中,这种特性利用得较多的是String类的intern()方法(把字符串常量池从方法区中剥离出来,存放在堆空间中)。
g.直接内存:并不是虚拟机运行时数据区的一部分,在jdk1.4中新加入了NIO类,引入一种基于通道与缓存区的I/O方式,它可以使用Native函数库直接分配堆外内存,通过一个存储在java堆中的DirectByteBuffer对象作为这块内存的引用,避免了在java堆和Native堆中来回负制数据。
2.对象(HotSpot虚拟机为例)
a.对象的创建(普通对象)
虚拟机遇到一条new指令时,首先检查这个指令参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载,解析和初始化过,如果没有,则先执行相应的类加载过程。检查通过后,虚拟机将为新生对象分配内存(所需内存在类加载完成后可确定)。为对象分配内存即在java堆中划分一块对象所需内存空间。分配方式一般有两种:指针碰撞和空闲列表。(选用哪种方式由java堆是否规整决定,是否规整由所采用的垃圾回收器是否带有压缩整理功能决定)
指针碰撞:假设java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的放在一边,中间放着一个指针作为分界点的指示器,分配内存仅仅是把指针向空闲空间移动一段与对象大小相等的距离。
空闲列表:如果java堆不是规整的,就必须维护一个列表记录哪些内存块可用,在分配时找出一块足够大的空间划分给对象,并更新列表。
为了保证在并发情况下分配内存,可以对分配内存空间的动作进行同步处理,也可以把内存分配动作按照线程划分在不同空间之中进行,称为本地线程分配缓冲(TLAB)。内存分配完成后,虚拟机将分配到的内存空间都初始化为零值(不包括对象头),这一步保证了对象实例字段在java代码中可以不赋初值就可以直接使用,然后虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例,如何找到类的元数据信息,对象的哈希码,对象的GC分代年龄等,这些信息存放在对象的对象头之中。一般来说,执行完new指令会接着执行<init>方法,把对象按照程序进行初始化。
b.对象的内存布局(组成)
对象在内存存储的布局分为3块区域:对象头,实例数据,对齐填充。
对象头包括两部分信息,第一部分用于存储对象自身的运行数据,如哈希码,锁状态标志,线程持有的锁等,这部分数据长度在32位和64位的虚拟机(未开启压缩指针)分别为32bit,64bit。另一部分是类型指针,即对象指向它类元数据的指针,虚拟机通过这个指针确定对象是哪个类的实例。如果对象是数组,那在对象头还必须有一块用于记录数组长度的数据。
实例数据是在代码块中所定义的各种类型的字段内容,无论从父类继承下来的,还是子类中定义的,都需要记录起来。这部分的存储顺序会受到虚拟机分配策略参数(FieldsAllocationStyle)和字段在java源码中定义的顺序的影响。
对齐填充并不是必然存在,也没有特别地含义,仅仅起着占位符的作用。
c.对象的访问定位
使用对象时,我们的java程序需要通过栈上的reference数据来操作堆上的具体对象。由于reference类型在java虚拟机规范只规定了一个指向对象的引用,没有定义具体方式,所以具体取决于虚拟机的实现。主流方式有使用句柄和直接指针。
句柄访问:java堆中会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的地址信息。
直接指针:java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接是对象地址。
两种方式各有优势,使用句柄最大好处是reference存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针。直接指针好处是节省了一次指针定位的时间,速度快。