写在前面
在日常的开发工作中,我们最常用也是最频繁的操作就是创建对象。可以说对象的创建始终伴随着我们的程序的开发和运行。那对象是如何被创建的呢?创建对象后,对象在内存中是一个怎样的结构?通过本文我们来深入了解一下对象的实例化过程、内存布局以及访问定位 对象的实例化过程 创建对象的方式要了解对象的实例化过程,我们需要先列举一下我们日常开发过程当中常用到的创建对象的方式,我们日常创建对象的方式大概有下面这六种:
new(最常见的方式)
单例模式(调用静态方法)
XxxBuilder、XxxFactory的静态方法
Class的newInstance(Xxx):反射的方式,只能调用空参的构造器,权限必须是public,JDK9中已经被标记为@Deprecated(弃用状态)
Constructor的newInstance(Xxx):反射的方式,可以调用空参、带参的构造器,权限无要求
使用clone():不调用任务构造器,当前类需要实现Cloneable接口的clone()方法
使用反序列化(进程间通信时传递数据的一种方式): 从文件中/网络中获取一个对象的二进制流,并将二进制流转换为Java Bean对象
public class JVM08 { public static void main(String[] args) { Object obj = new Object(); }}
上述代码非常简单,就是在main()方法中创建了一个Object类型的对象并赋值给obj变量,将它编译成字节码之后通过jclasslib插件处理后我们就可以看到上述代码对应的字节码指令如下:
new指令
-
判断一下在方法区当中是否已经加载了对应的类。如果没有加载,则需要使用对应的类加载器进行加载
在堆空间中开辟要创建的对象对应的内存空间
对成员变量进行零值初始化(默认初始化)
dup复制指令
invokeSpecial指令
astore_1指令
判断对象对应的类是否加载->链接->初始化
为对象分配内存
堆空间内存规整,使用指针碰撞
如果内存是规整的,那么虚拟机将采用的是指针碰撞算法来为对象分配内存。即所有用过的内存在一边,空闲的内存在另一边,中间存放着一个指针作为分界点的指示器。分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离。如果垃圾收集器选择的是Serial、Parnew这种基于压缩算法的,虚拟机采用这种分配方式。一般带有compact(整理)过程的收集器时,使用指针碰撞
堆空间内存不规整,使用空闲列表分配
如果内存不是规整的,已使用的内存和未使用的内存相互交错,那么虚拟机将采用的是空闲列表法来为对象分配内存(CMS垃圾收集器)。即虚拟机维护了一个列表用来记录哪些指针是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的内容。这种分配方式称为空闲列表分配
PS:选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。
处理并发安全问题
创建对象是非常频繁的操作,虚拟机采用两种方式解决并发问题
CAS失败重试/区域加锁:保证指针更新操作的原子性
线程私有缓冲区
TLAB -> Thread Local Allocation Buffer
概念
从内存模型而不是垃圾收集的角度,对Eden区域继续进行划分,JVM为每一个线程分配了一个私有缓冲区,它包含在Eden空间内
多线程同时分配内存时,使用TLAB可以避免一系列的非线程安全问题,同时还能够提升内存分配的吞吐量,因此我们可以将这种内存分配方式称之为快速分配策略
优势:堆区是线程共享区域,任何线程都可以访问到堆区中的共享数据,由于对象实例的创建在JVM中非常频繁,因此在并发环境下从堆区中划分内存空间是线程不安全的,为了避免多个线程操作同一个地址,需要使用加锁等机制,进而影响分配速度。基于数据安全和性能考虑,设置私有缓冲区可以避免资源抢夺和加锁带来的问题
特点:
尽管不是所有的对象实例都能够在TLAB中成功分配内存,但JVM确实是将TLAB作为内存分配的首选
默认情况下,TLAB空间的内存占用非常小,仅占有整个Eden空间的1%
一旦对象在TLAB空间分配内存失败时,JVM就会尝试着通过使用加锁机制确保数据操作的原子性,从而直接在Eden空间中分配内存
参数设置
// 设置TLAB在Eden的占用空间-XX:TLABWasteTargetPercent// 设置是否开启TLAB空间(JDK8默认开启)-XX:+UseTLAB
初始化内存空间
内存分配结束,虚拟机将分配到的内存空间做零值初始化(不包含对象头)
设置对象头
执行init方法进行初始化(显示初始化、代码块中初始化、构造器中初始化 )
对象的内存布局(对象的组成)
一个对象被创建出来后,它在内存中的结构会是什么样子的呢?对象在内存的结构主要由三部分构成:对象头
运行时元数据
哈希值(栈空间的局部变量表中的变量指向的堆空间的对象的首地址值)
GC分代年龄
锁状态标志
线程持有的锁
偏向线程ID
偏向时间戳
类型指针: 指向类元数据InstanceClass,确定该对象所属的类型(并不是所有的虚拟机实现都必须在对象数据上保留类型指针)。如果是数组类型,还需记录数组长度
实例数据区:对象真正存储的有效信息,包括程序代码中定义的各种类型的字段(包括从父类继承下来的和本身拥有的字段)
相同宽度的字段总是被分配在一起(例如同为4字节或8字节的字段会放到一起)
父类中定义的变量会出现在子类之前
如果CompactFields参数为true:子类的窄变量可能插入到父类变量的空隙
对齐填充:仅仅起到占位符的作用
为了更形象的表述对象的内存布局,我们先看下面一段代码:
上述代码的main()方法中创建了一个Customer对象,并且在Customer对象中有三个成员变量,分别对应三种初始化方式。其内存布局如下图所示: 对象的访问定位首先思考一个问题,JVM是如何访问堆中的对象实例的呢?对Java内存布局有一定了解的小伙伴应该都比较了解,JVM其实是通过栈帧的局部变量表中的reference进行访问的。其实reference访问目前普遍流行的有两种方式,JVM规范中没有明确规定要使用哪一种,所以不同的JVM实现也不尽相同。这两种方式为句柄访问和直接指针。
句柄访问栈上的reference指向句柄池,在句柄池中针对一个对象分为两部分,一个指针指向对象的实例数据,另一个指针指向方法区的类对象,用来引用对象所属的类型。句柄访问的方式如下图所示:
优势:refrence中存储稳定句柄地址,对象被移动时只会改变句柄中实例数据指针即可,reference本身不需要被修改
缺点:访问内部对象需要先访问句柄池,效率较低
直接指针(HotSpot虚拟机采用)
栈上的reference直接指向对象本身,在对象内部(对象头)会存在一个类型指针指向方法区中的指向方法区的类对象,用来引用对象所属的类型。直接指针的方式如下图所示:优势:reference中直接存储对象实例的指针,访问效率较高
缺点:对象地址变更时(垃圾回收时,标记整理或复制算法),需要变更reference引用
以上就是对象实例化、内存布局和访问定位的全部内容,想要做更深入的学习可以阅读Oracle官方提供的JVM规范手册,相信会有更大的收货,谢谢小伙伴们的阅读