Java对象的创建和结构(深入JVM理解)

23 篇文章 0 订阅

初学Java时,也就知道new对象这种创建对象的方式,随着学习深入和经验积累,也知道了一些其他的创建对象的方式,但还是没有深入去理解学习Java虚拟机是如何创建对象的,这篇文化主要内容就是深入虚拟机去理解学习Java对象的创建。
本文的内容都是以HotSpot虚拟机为主。

一、背景:Java创建对象的方式有哪些?

这个问题可能你会在面试的时候遇到,我就曾经遇到过,答案主要是四种创建对象的方式。
(1)关键字new
  最常见也是最简单的创建对象的方式,可以调用任意的构造函数。

Demo demo = new Demo();

(2)反射
  调用Java.lang.Class或者java.lang.reflect.Constructor类的newInstance()实例方法,调用了构造函数。

//调用Java.lang.Class类的newInstance()实例方法。
Demo demo = Demo.class.newInstance();
//调用java.lang.reflect.Constructor类的newInstance()实例方法。
Demo demo = Demo.class.getConstructor().newInstance();

注意:
  事实上Class的newInstance方法内部调用Constructor的newInstance方法。这也是众多框架,如Spring、Hibernate、Struts等使用后者的原因。

(3)clone()方法
  无论何时我们调用一个对象的clone方法,jvm就会创建一个新的对象,将前面对象的内容全部拷贝进去。用clone方法创建对象并不会调用任何构造函数。
要使用clone方法,我们需要先实现Cloneable接口并实现其定义的clone方法。

Demo demo = (Demo)demo1.clone();

(4)反序列化
  调用java.io.ObjectInputStream对象的readObject()方法
  当我们序列化和反序列化一个对象,jvm会给我们创建一个单独的对象。在反序列化时,jvm创建对象并不会调用任何构造函数
  为了反序列化一个对象,我们需要让我们的类实现Serializable接口。

ObjectInputStream in = new ObjectInputStream(new FileInputStream("data.obj"));
Demo demo = (Demo) in.readObject();

(5)使用Unsafe类创建对象
  Unsafe类使Java拥有了像C语言的指针一样操作内存空间的能力,同时也带来了指针的问题。过度的使用Unsafe类会使得出错的几率变大,因此Java官方并不建议使用的,官方文档也几乎没有。Oracle正在计划从Java 9中去掉Unsafe类,如果真是如此影响就太大了。
  我们无法直接创建Unsafe对象。这里我们使用反射方法得到:

private static Unsafe getUnsafe() {
	try {
		Field field = Unsafe.class.getDeclaredField("theUnsafe");
		field.setAccessible(true);
		Unsafe unsafe = (Unsafe) field.get(null);
		return unsafe;
	} catch (Exception e) {
		e.printStackTrace();
	}
	return null;
}

获取到这个对象后,调用其中的native方法allocateInstance创建一个对象实例:

Object event = unsafe.allocateInstance(Test.class);

从Java虚拟机层面看,除了使用new关键字创建对象(<init>(invokespecial))的方式(使用new关键字来调用一个类的构造函数显式地创建对象,这种方式在Java规范中被称为 : 由执行类实例创建表达式而引起的对象创建)外,其他方式全部都是通过转变为invokevirtual指令直接创建对象的。

二、对象的创建过程

这里以new关键字创建对象(仅限于普通Java对象,不包括数组和Class对象等)为例:

Java虚拟机角度分析对象创建步骤:

第一步:类加载检查
  Java虚拟机遇到一条字节码new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程

第二步:虚拟机将为新生对象分配内存
  类加载检查通过后,接下来虚拟机将会为新生对象分配内存。对象所需内存的大小在类加载完成后便可完全确定(如何确定?-对象的内存布局),为对象分配空间的任务实际上便等同于把一块确定大小的内存块从Java堆中划分出来。
1.分配内存的方式:
(1)指针碰撞(Bump The Pointer)
  假设Java堆中内存时绝对规整的,所有被使用过的内存都被放在一边,空闲的内存被放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间方向挪动一段与对象大小相等的距离。
(2)空闲列表(Free List)
  如果Java堆中的内存并不是规整的,已被使用的内存和空闲的内存相互交错在一起,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配内存的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。
注意
  选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有空间压缩整理(Compact)的能力决定

2.线程安全问题?Java是支持多线程的,对象创建是非常频繁的,怎样保证线程安全呢?
  可能出现的情况,正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况。
解决方案:
方案一:
  对分配内存空间的动作进行同步处理,实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性
方案二:
  将内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB),哪个线程要分配内存,就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定

第三步:虚拟机必须将分配到的内存空间(但不包括对象头)都初始化为零值
  如果使用了TLAB的话,这一项工作也可以提前值TLAB分配时顺便进行。这步操作保证了对象的实例字段在Java代码中可以不赋初始值就可以直接使用,使程序能访问到这些字段的数据类型所对应的零值。

第四步:Java虚拟机对对象进行必要的设置
  例如,这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码(实际上对象的哈希码会延后到真正调用Object::hashCode()方法才计算)、对象的GC分代年龄等信息。这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头(本文第三节)会有不同的设置方式。

注意:
  经过上面四步,从虚拟机的角度来看,一个新的对象已经产生了;但从Java程序的视角看来,对象创建才刚开始-构造函数还没有执行。

第五步:执行Class文件中的<init>()方法执行构造函数),按照程序员的意愿对对象进行初始化
  执行构造函数前,所有的字段都为默认的零值,对象需要的其他资源和状态信息也还没有按照预定的意图构造好。

经过上面五个步骤,一个对象算是创建完成。

三、对象的结构

对象再堆内存中的 存储布局可以划分为三个部分:对象头(Header)实例数据(Instance Data)对其填充(Padding)
1、对象头(Header)
包含两类信息:
(1)用于存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
(2)是类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。

2、实例数据(Instance Data)
  对象真正存储的有效信息,即我们在程序代码里面所定义的各种类型的字段内容,无论是从父类继承下来的,还是在子类中定义的字段都必须记录起来。

3、对齐填充(Padding)
  这并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。对象头部分已经被精心设计成正好是8字节的倍数(1倍或者2倍),因此,如果对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。

四、对象的访问定位

创建对象自然是为了后续使用该对象,我们的Java程序会通过栈上的reference数据来操作堆上的具体对象。由于reference类型在《Java虚拟机规范》里面只规定了它是一个指向对象的引用,并没有定义这个引用应该通过什么方式定位、访问到堆中对象的具体位置,所以对象访问方式也是由虚拟机实现而定的。

主流的访问方式主要由使用句柄和直接指针两种:
(1)方式一:句柄访问
1)概念:
  Java堆中将可能会划分出一块内存作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息
2)优点:
  reference中存储的是稳定句柄地址,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要被修改。
3)图示
  Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象句柄位置,而句柄中包含了对象实例数据类型数据各自的具体地址信息
在这里插入图片描述

(2)方式二:直接指针访问
1)概念:
  Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。
2)优点:
  最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象访问在Java中非常频繁,因此这类开销积少成多也是一项极为可观的执行成本。HotSpot默认用的就是直接指针访问,也有例外情况这里就不赘述。
3)图示
如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址
在这里插入图片描述

五、类的初始化过程与类的实例化过程

1、初始化
  指类加载过程中的初始化阶段对类变量按照程序猿的意图进行赋值的过程
(1)实例变量初始化
(2)实例代码块初始化
(3)构造函数初始化

2、实例化
  指在类完全加载到内存中后创建对象的过程

3、小结
  在准备实例化一个类的对象前,首先准备实例化该类的父类,如果该类的父类还有父类,那么准备实例化该类的父类的父类,依次递归直到递归到Object类。此时,首先实例化Object类,再依次对以下各类进行实例化,直到完成对目标类的实例化。具体而言,在实例化每个类时,都遵循如下顺序:先依次执行实例变量初始化和实例代码块初始化,再执行构造函数初始化。也就是说,编译器会将实例变量初始化和实例代码块初始化相关代码放到类的构造函数中去,并且这些代码会被放在对超类构造函数的调用语句之后,构造函数本身的代码之前。
  Java要求在实例化类之前,必须先实例化其超类,以保证所创建实例的完整性。这一点实际就是在构造函数中保证的。

4、一个实例变量在对象初始化的过程中会被赋值几次?
  我们知道,JVM在为一个对象分配完内存之后,会给每一个实例变量赋予默认值,这个时候实例变量被第一次赋值,这个赋值过程是没有办法避免的。如果我们在声明实例变量x的同时对其进行了赋值操作,那么这个时候,这个实例变量就被第二次赋值了。如果我们在实例代码块中,又对变量x做了初始化操作,那么这个时候,这个实例变量就被第三次赋值了。如果我们在构造函数中,也对变量x做了初始化操作,那么这个时候,变量x就被第四次赋值。也就是说,在Java的对象初始化过程中,一个实例变量最多可以被初始化4次。

六、init和clinit

1、<clinit>()方法-类初始化
  Java类加载的初始化过程中,编译器按语句在源文件中出现的顺序,依次自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并产生<clinit>() 方法。 如果类中没有静态语句和静态代码块,那可以不生成<clinit>() 方法
  并且 <clinit>() 不需要显式调用父类(接口除外,接口不需要调用父接口的初始化方法,只有使用到父接口中的静态变量时才需要调用)的初始化方法 <clinit>(),虚拟机会保证在子类的 <clinit>() 方法执行之前,父类的<clinit>()方法已经执行完毕。
注意:
(1)<clinit>()方法由静态类变量显示赋值代码和静态代码块组成;
(2)类变量显示赋值代码和静态代码块代码从上到下顺序执行;
(3)<clinit>()方法只执行一次;

2、<init>()方法-实例初始化
  对象构造时用以初始化对象的构造器以及非静态初始化块中的代码。也可以说是指收集类中的所有实例变量的赋值动作、实例代码块和构造函数合并产生的。

注意:
(1)<init>()方法可能重载有多个,有几个构造器就有几个<init>方法
(2)<init>()方法由非静态实例变量显示赋值代码和非静态代码块、对应构造器代码组成;
(3)非静态实例变量显示赋值代码和非静态代码块代码从上到下顺序执行,而对应构造器的代码最后执行;
(4)每次创建实例对象,调用对应构造器,执行的就是对应的<init>方法
(5)<init>方法的首行是super()或super(实参列表),即对应父类的<init>方法

附录:创建对象时的几个关键应用规则

(1)避免在循环体中创建对象,即使该对象占用内存空间不大。
(2)尽量及时使对象符合垃圾回收标准。
(3)不要采用过深的继承层次。
(4)访问本地变量优于访问类中的变量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值