Java对象的创建过程、内存布局、访问定位


1. Java对象的创建过程

在这里插入图片描述

1.1 步骤一:类加载检查

当Java虚拟机遇到一条字节码new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并检查这个符号引用代表的类是否已被加载、解析和被初始化过。如果没有,那必须先执行相应的类加载过程

1.2 步骤二:为新生对象分配内存

对象所需要内存的大小,在类加载完成后便可以完全确定,为对象分配空间的任务实际上便等同于把一块确定大小的内存从Java堆中划分出来

1.2.1 内存分配的两种方式

1.2.1.1 指针碰撞(Bump The Pointer)

假设Java堆中内存是绝对规整的,所有被使用过的内存都被放到一边,空闲的内存被放在另一边,中间放置一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲方向挪动一段于对象大小相等的距离

图示:
在这里插入图片描述

1.2.1.2 空闲列表(Free List)

如果Java堆中的内存并不是规整的,已被使用的内存和空闲的内存相互交错在一起,那就没有办法简单的进行指针碰撞了,虚拟机就必须维护一个列表,记录上那些内存是可用的,再分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录

图示:
在这里插入图片描述

1.2.1.3 选择哪种分配方式

Java堆是否规整决定,而Java堆是否规整由所采用的垃圾收集器是否带有空间压缩整理(Compact)决定。因此当使用Serial、ParNew等带压缩整理过程的收集器是,系统采用分配算法是指针碰撞,即简单有高效;而当使用CMS这种基于清理(Sweep)算法的收集器时,理论上就只能采用较为复杂的空间列表来分配内存

1.2.2 内存分配并发情况下的问题

由于对象创建在虚拟机中是非常频繁的行为,即使仅仅修改一个指针所指向的位置,在并发的情况下也并不是线程安全的,可能出现长在给A对象分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况

解决方案
1.2.2.1 CAS+失败重试

对分配内存空间的动作进行同步处理——实际上虚拟机是采用CAS+失败重试的方案保证更新操作的原子性

1.2.2.2 TLAB+(CAS+失败重试)

把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区是才需要同步锁定,可以通过 -XX:+/-UseTLAB参数来设定虚拟机是否使用TLAB

1.3 步骤三:将分配到的内存空间(不包含对象头)初始化为零值

虚拟据必须将分配到的内存空间(不包含对象头)初始化为零值,如果使用了TLAB的话,这一项工作也可以提前到TLAB分配时顺便进行。
这步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,使程序能访问到这些字段数据类型所对应的零值。

1.4 步骤四:虚拟据对对象进行必要设置(对象头设置)

虚拟机对对象进行必要设置,例如这个对象是那个类的实例,如何能找到类的元数据信息,对象的哈希码(实际上对象的哈希码会延后到调用Object::hashCode()方法时才计算)、对象的GC分代年龄等信息,这些信息都存放在对象的对象头(Object Header)中

1.5 步骤五: 执行Class文件中的init() 方法

经过以上4步以后,从虚拟机的角度来看,一个新的对象已经产生了。但对于我们的程序来说,对象的创建才刚刚开始——构造函数,即Class文件中的<init>()方法还没有执行,所有的字段都是默认的零值,对象所需要的其他资源和状态信息并没有按照我们的预定意愿构造好。
new指令之后会接着执行<init>()方法,按照我们的意愿对对象进行初始化,这样一个真正可用的对象才算完全被构造出来。


2 对象的内存布局

在HotSpot虚拟机中,对象在堆内存中的存储布局可以划分为三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)
在这里插入图片描述

2.1 对象头(Header)

包含两部分:

  • Mark Word 存储对象自身的运行时数据
1. 如哈希码(HashCode)、GC分代年龄、锁状态标识、线程持有的锁、偏向线程ID、偏向时间戳等
2. Mark Word被设计成一个有这动态定义的数据结构,以便在极小的空间内存储尽量夺得数据,
   根据对象的状态复用自己的存储空间
  • 类型指针(class pointer)
1. 对象指向它的类元数据的指针
2. Java虚拟机通过这个指针来确定这个对象是哪个类的实例
  • 注意对象是数组的情况
    如果对象 是 数组,那么在对象头中还必须有一块用于记录数组长度的数据
     因为虚拟机可以通过普通Java对象的元数据信息确定对象的大小,但如果数组的长度是不确定的,将
   无法通过元数据中的信息推断出数组的大小。

2.2 实例数据(Instance Data)

  • 这部分是对象真正存储的有效信息
程序代码里定义的给各类类型的字段内容(无论是继承与父类,还是子类中的定义字段)
这部分数据的存储顺序会受到虚拟机分配参数(-XX:FieldAllocationStyle)和字段在Java源码中定义顺序的影响。
  • HotSpot虚拟机默认的的分配顺序
longs/doubles、ints、shorts/chars、bytes/booleans、oop(Ordinary Object Pointers)
从分配策略中可以看出,相同宽度的字段总是被分配到一起
在满足这个前提的条件下,父类中定义的变量会出现在子类之前
  • 如果 虚拟机的+XX:CompactFields 参数值为true,那么子类之中较窄的变量也可能会插入到父类变量的空隙之中。

2.3 对齐填充(Padding)区域

  • 这并不是必然存在的,也没有特殊的含义,仅仅起着占位符的作用
  • 因为HotSpot VM的要求对象起始地址必须是8字节的整数倍,且对象头部分正好是8字节的倍数。所以,当对象实例数据部分没有对齐时(即对象的大小不是8字节的整数倍),就需要通过对齐填充来补全。

3 对象的访问定位

  • 我们创建对象自然是为了使用该对象,实际上就是访问对象类型数据 & 对象实例数据
  • Java程序 通过 栈上的引用类型数据(reference) 来访问Java堆上的对象,由于引用类型数据(reference)在 Java虚拟机中只规定了一个指向对象的引用,但没定义该引用应该通过何种方式去定位、访问堆中的对象的具体位置所以对象访问方式取决于虚拟机实现。目前主流的对象访问方式有两种:句柄访问和直接指针访问

3.1 使用句柄访问

Java堆中将可能会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。
在这里插入图片描述

3.1.1 优势

  • reference中存储的是稳定的句柄地址
  • 在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要修改
  • 垃圾收集时移动对象是非常普遍的行为

3.1.2 使用场景

需频繁移动对象地址

3.2 使用直接指针访问

Java堆中对象的内存布局就必须考虑如何放置访问类型的相关信息,reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。
在这里插入图片描述

3.2.1优势

  • 速度更快,它节省了一次指针定位的时间开销

3.2.3 使用场景

需频繁访问对象

参考

本内容基本来自《深入理解Java虚拟机》第三版 –周志明。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值