其他信息: 未将对象引用设置到对象的实例。_深入理解对象的实例化、内存布局和访问定位...

巫-挖泥巴

于 2021-01-27 08:58:35 发布

阅读量315

点赞数

文章标签：其他信息: 未将对象引用设置到对象的实例。

本文链接：https://blog.csdn.net/weixin_35715474/article/details/113367077

版权

写在前面

在日常的开发工作中，我们最常用也是最频繁的操作就是创建对象。可以说对象的创建始终伴随着我们的程序的开发和运行。那对象是如何被创建的呢？创建对象后，对象在内存中是一个怎样的结构？通过本文我们来深入了解一下对象的实例化过程、内存布局以及访问定位 对象的实例化过程 创建对象的方式

要了解对象的实例化过程，我们需要先列举一下我们日常开发过程当中常用到的创建对象的方式，我们日常创建对象的方式大概有下面这六种：

new(最常见的方式)
单例模式(调用静态方法)
XxxBuilder、XxxFactory的静态方法
Class的newInstance(Xxx)：反射的方式，只能调用空参的构造器，权限必须是public，JDK9中已经被标记为@Deprecated(弃用状态)
Constructor的newInstance(Xxx)：反射的方式，可以调用空参、带参的构造器，权限无要求
使用clone()：不调用任务构造器，当前类需要实现Cloneable接口的clone()方法
使用反序列化(进程间通信时传递数据的一种方式): 从文件中/网络中获取一个对象的二进制流，并将二进制流转换为Java Bean对象

创建对象的过程 字节码 首先我们从字节码指令的角度来看一下创建对象的过程，先看下面一段代码

public class JVM08 {    public static void main(String[] args) {        Object obj = new Object();    }}

上述代码非常简单，就是在main()方法中创建了一个Object类型的对象并赋值给obj变量，将它编译成字节码之后通过jclasslib插件处理后我们就可以看到上述代码对应的字节码指令如下：

new指令

1. 判断一下在方法区当中是否已经加载了对应的类。如果没有加载，则需要使用对应的类加载器进行加载
2. 在堆空间中开辟要创建的对象对应的内存空间
3. 对成员变量进行零值初始化(默认初始化)

dup复制指令

在虚拟机栈的操作数栈中进行复制操作。即有两个引用指向对空间，栈底的引用主要用于赋值操作，栈顶的引用作为句柄，会涉及到调用相关的方法。

invokeSpecial指令

方法调用指令，调用对象的 构造方法

astore_1指令

将obj变量从操作数栈中取出并存储到局部变量表下标为1的位置(下标为0的位置存储的是main()方法的形参args)

对象创建的执行过程

判断对象对应的类是否加载->链接->初始化

虚拟机遇到一条new指令，首先去检查这个指令的参数 能否在 元空间的常量池中定位到一个类的符号引用 ，并且检查这个符号引用代表的类是否已经被 加载、链接、初始化 (即判断类原信息是否存在)。如果没有， 在双亲委派模式下，使用当前类加载器以ClassLoader + 包名 + 类型为key进行查找对应的.class文件 。如果没有找到文件，则抛出ClassNotFoundException异常。如果找到,则进行类加载并生成对应的Class类对象

为对象分配内存

首先计算对象占用空间大小，接着在堆中划分一块内存给新对象。如果实例成员变量是引用类型，仅分配引用变量空间即可，即4个字节

堆空间内存规整，使用指针碰撞

如果内存是规整的，那么虚拟机将采用的是指针碰撞算法来为对象分配内存。即所有用过的内存在一边，空闲的内存在另一边，中间存放着一个指针作为分界点的指示器。分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离。如果垃圾收集器选择的是Serial、Parnew这种基于压缩算法的，虚拟机采用这种分配方式。一般带有compact(整理)过程的收集器时，使用指针碰撞

堆空间内存不规整，使用空闲列表分配

如果内存不是规整的，已使用的内存和未使用的内存相互交错，那么虚拟机将采用的是空闲列表法来为对象分配内存(CMS垃圾收集器)。即虚拟机维护了一个列表用来记录哪些指针是可用的，在分配的时候从列表中找到一块足够大的空间划分给对象实例，并更新列表上的内容。这种分配方式称为空闲列表分配

PS：选择哪种分配方式由Java堆是否规整决定，而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。

处理并发安全问题

创建对象是非常频繁的操作，虚拟机采用两种方式解决并发问题

CAS失败重试/区域加锁：保证指针更新操作的原子性
线程私有缓冲区

TLAB -> Thread Local Allocation Buffer

概念
- 从内存模型而不是垃圾收集的角度，对Eden区域继续进行划分，JVM为每一个线程分配了一个私有缓冲区，它包含在Eden空间内
- 多线程同时分配内存时，使用TLAB可以避免一系列的非线程安全问题，同时还能够提升内存分配的吞吐量，因此我们可以将这种内存分配方式称之为快速分配策略
优势：堆区是线程共享区域，任何线程都可以访问到堆区中的共享数据，由于对象实例的创建在JVM中非常频繁，因此在并发环境下从堆区中划分内存空间是线程不安全的，为了避免多个线程操作同一个地址，需要使用加锁等机制，进而影响分配速度。基于数据安全和性能考虑，设置私有缓冲区可以避免资源抢夺和加锁带来的问题
特点：
- 尽管不是所有的对象实例都能够在TLAB中成功分配内存，但JVM确实是将TLAB作为内存分配的首选
- 默认情况下，TLAB空间的内存占用非常小，仅占有整个Eden空间的1%
- 一旦对象在TLAB空间分配内存失败时，JVM就会尝试着通过使用加锁机制确保数据操作的原子性，从而直接在Eden空间中分配内存
参数设置

// 设置TLAB在Eden的占用空间-XX:TLABWasteTargetPercent// 设置是否开启TLAB空间(JDK8默认开启)-XX:+UseTLAB

初始化内存空间

内存分配结束，虚拟机将分配到的内存空间做零值初始化(不包含对象头)

设置对象头

将对象的所属类(即类的元数据信息)、对象的HashCode和对象的GC信息、锁信息等数据存储在对象的对象头中

执行init方法进行初始化(显示初始化、代码块中初始化、构造器中初始化 )

初始化成员变量，执行实例化代码块，调用类的构造方法，并把类的对象的首地址赋值给引用变量，此时一个真正可用的对象才算完全创建出来

对象的内存布局(对象的组成)

一个对象被创建出来后，它在内存中的结构会是什么样子的呢？对象在内存的结构主要由三部分构成：

对象头
- 运行时元数据
  - 哈希值(栈空间的局部变量表中的变量指向的堆空间的对象的首地址值)
  - GC分代年龄
  - 锁状态标志
  - 线程持有的锁
  - 偏向线程ID
  - 偏向时间戳
- 类型指针: 指向类元数据InstanceClass，确定该对象所属的类型(并不是所有的虚拟机实现都必须在对象数据上保留类型指针)。如果是数组类型，还需记录数组长度
实例数据区：对象真正存储的有效信息，包括程序代码中定义的各种类型的字段(包括从父类继承下来的和本身拥有的字段)
- 相同宽度的字段总是被分配在一起(例如同为4字节或8字节的字段会放到一起)
- 父类中定义的变量会出现在子类之前
- 如果CompactFields参数为true：子类的窄变量可能插入到父类变量的空隙
对齐填充：仅仅起到占位符的作用

为了更形象的表述对象的内存布局，我们先看下面一段代码：

上述代码的main()方法中创建了一个Customer对象，并且在Customer对象中有三个成员变量，分别对应三种初始化方式。其内存布局如下图所示：

对象的访问定位

首先思考一个问题，JVM是如何访问堆中的对象实例的呢？对Java内存布局有一定了解的小伙伴应该都比较了解，JVM其实是通过栈帧的局部变量表中的reference进行访问的。其实reference访问目前普遍流行的有两种方式，JVM规范中没有明确规定要使用哪一种，所以不同的JVM实现也不尽相同。这两种方式为句柄访问和直接指针。

句柄访问

栈上的reference指向句柄池，在句柄池中针对一个对象分为两部分，一个指针指向对象的实例数据，另一个指针指向方法区的类对象，用来引用对象所属的类型。句柄访问的方式如下图所示：