1.运行时数据区域
Java虚拟机在执行Java程序的时候会把它所管理的内存划分为多个不同的数据区域:
- 方法区:线程共享,存储已被虚拟机加载的类信息、常量、静态变量、即使编译器编译后的代码等数据。
- 堆:线程共享,存放实例对象。物理上不连续,逻辑上连续。垃圾收集器管理的主要区域。
- 虚拟机栈:线程私有,用于存储局部变量表、操作数栈、动态链接、方法出口等信息。
- 本地方法栈:类似于虚拟机栈,为Native方法服务。
- 程序计数器:线程私有,存储下一条要执行的指令的地址
- 运行时常量池:方法区的一部分。存储Class文件中的常量池:各种字面量和符号引用。
2.Hotspot虚拟机对象探秘
2.1 对象的创建
new ClassName()
(1).定位:首先检查这个指令的参数是否能在常量池定位到一个类的符号引用,即是否存在ClassName这个符号引用;
(2).加载:如果存在,检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。
(3).分配:类加载检查通过后,接下来为对象分配内存。分配内存主要有两种方式:
- 指针碰撞:如果Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把指针向空闲空间挪动一段与对象大小相等距离。
- 空闲列表:如果Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,虚拟机就必须维护一个列表,记录那些内存是可用的,则需要在分配的时候从列表中找出一块足够大的空间划分给对象实例,并更新列表上的记录。
(4).线程安全问题:如果线程A给对象分配内存,指针还没来得及修改,线程B又同时使用了原来的指针来分配内存的情况。
解决这个问题有两种方案:
a.一种是对分配内存空间的动作进行同步处理——实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性;
b.另一种是把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲。哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定。
(5).内存初始化为零(不包括对象头)
(6).设置对象头:元数据信息、对象的哈希码、对象的GC分代年龄等信息
(7).执行<init>方法
2.2 对象的布局
对象在内存中存储的布局分为三块区域:对象头,实例数据和对齐填充。
(1)对象头包括两部分信息
- 第一部分用于存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
表2-1 HotSpot虚拟机对象头Mark Word
状态 | 存储内容 | 标志位 |
---|---|---|
未锁定 | 对象哈希码、对象分代年龄 | 01 |
轻量级锁定 | 指向锁记录的指针 | 00 |
膨胀(重量级锁定) | 指向重量级锁的指针 | 10 |
GC标记 | 空,不需要记录信息 | 11 |
可偏向 | 偏向线程ID、偏向时间戳、对象分代年龄 | 01 |
- 对象头的另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据,因为虚拟机可以通过普通Java对象的元数据信息确定Java对象的大小,但是从数组的元数据中却无法确定数组的大小。
(2).接下来的实例数据部分是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。包括父类中继承下来的字段。
(3).第三部分对齐填充并不是必然存在的,它仅仅起着占位符的作用。因为Hotspot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,即对象大小必须是8字节的整数倍。
2.3 对象的访问定位
图2-1 通过句柄访问对象
图2-2 通过指针访问对象
这两种对象访问方式各有优势,使用句柄来访问的最大好处就是reference中存储的是稳定的句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要修改。
摘自《深入理解Java虚拟机》——周志明著,如与原书有冲突,请以原书为准