目标
探讨HotSpot虚拟机在Java堆中对象分布、布局和访问的全过程。
1.对象的创建
- 虚拟机遇到一条new指令时,先去检查这个指令的参数能否在常量池中定位到一个类的符号引用(有没有属性相同的类),并且检查这个符号引用代表的类是否被加载、解析、初始化过。如果没有,那必须先执行相应的类加载过程。(关于类加载过程后面再探讨)
- 类加载检查通过后,虚拟机将为对象分配内存。所需要的内存大小在类加载完成后就能知道。分配内存就等同于把一块确定大小的内存从Java堆中划分出来。有两种分配内存的方式:
(1). 指针碰撞
要求Java堆的内存是规整的,用过的内存在一边,没用过的内存在另一边,中间用一个指针分割,那分配内存就是把这个指针往未分配的内存的一边移动要分配的内存的距离。
(2). 空闲列表
Java堆的内存不是规整的,已使用的内存和未使用的内存互相交错,那就不能指针碰撞了,虚拟机要维护一个列表,记录哪些内存块是可用的,分配的时候找到一块足够大的空闲内存划分给对象,并更新列表。
采用哪种分配方式取决于Java堆是否规整,Java堆是否规整又由所采用的垃圾收集器是否有压缩整理的功能决定。
除此之外,还有一个问题就是创建对象时一个非常频繁的行为,仅仅修改一个指针的位置,在并发状态下并不是线程安全的。解决这个问题有两种方案:
(1). 对分配内存空间的动作进行同步处理
(2). 把内存分配的动作划分在不同的空间中进行,即每个内存在Java堆中预先分配一小块内存,称为本地线程分配缓冲(TLAB),哪个线程要分配内存,就在哪个线程的TLAB上分配在,只有TLAB用完并分配新的TLAB时,才需要同步锁定。 - 内存分配完成后,虚拟机将分配到的内存空间都初始化为零值(不包括对象头),如果使用TLAB,可以在分配TLAB就初始化。这一步保证了对象的实例字段在Java代码中不赋初值就可以直接使用。
- 虚拟机要对对象做必要的设置。将必要的信息存放在对象头中。
2.对象的内存布局
在HotSpot虚拟机中,对象在内存中存储的布局可以分为三块区域:对象头、实例数据、对齐填充。
对象头包括两部分,一部分是对象自身运行时的数据,如HashCode等。这部分数据长度在32位和64位的虚拟机中分别为32bit和64bit。对象头另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
实例数据部分是对象真正存储的有效信息,也是在程序中定义的各种类型的字段内容。
对齐填充不是必然存在的,也没什么特别的含义,仅仅起到占位符的作用,当对象实例数据部分没有对齐时,通过对齐填充来补全。
3.对象的访问定位
主流的访问方式有使用句柄和直接指针两种。
如果使用句柄访问的话,Java堆中将会划分出一块内存作为句柄池,栈上的reference数据存储的就是对象的句柄语句,而句柄中包含了对象实例数据和类型数据各自的具体地址信息。
如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址。
使用句柄访问的好处:reference中存储的是稳定的句柄地址,对象被移动时只需改变句柄中的实例数据指针,reference不变。
使用直接指针的好处:速度快。HotSpot虚拟机使用这一种,但是句柄访问也不少见。
参考资料
图书:深入了解Java虚拟机。