Java是面向对象的编程语言,在Java程序运行过程中随时都有对象被创建出来。那对象的创建是怎样一个过程呢?
通常,创建对象分为五个步骤:
- 检查类是否加载
- 分配内存
- 初始化零值
- 设置对象头
- 执行方法(该方法由实例成员变量声明、实例初始化块和构造方法组成)。
一、类加载
虚拟机遇到一条new指令时,首先去检查这个指令的参数能否在常量池中定位到一个类的符号引用。然后检查这个符号引用代表的类是否已经被加载、解析和初始化过。
如果没有,那必须先执行相应的类加载过程。
为什么要检查类是否加载?
因为类的加载通常是懒加载,只有在使用这个类时才会去加载,而且一般不会重复加载。
二、分配内存
类加载完成后,对象所需要内存的大小也就确定了。此时虚拟机会在堆内存中划分一块确定大小的内存空间出来,分配给新生对象。
划分方式有两种:
- 指针碰撞
- 空闲列表
使用Serial,ParNew等带有Compact过程的收集器时,系统采用指针碰撞;使用CMS这种基于Mark-Sweep算法的收集器时,通常采用空闲列表。
1. 指针碰撞
假设Java堆中内存是规整的,所有用过的内存都在一边,空闲的内存在另一边,中间有一个指针作为分界点的指示器,那分配内存就是把指针向空闲空间那边挪动一段与对象大小相等的距离。这种分配方式叫指针碰撞,Bump the Pointer。
2. 空闲列表
如果Java堆中内存不是规整的,已使用的内存和空闲的内存相互交错,那就没办法简单地进行指针碰撞了。虚拟机把内存分成一系列的内存块,然后它维护一个列表,记录哪些内存块是可用的。分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录。这种分配方式叫空闲列表,Free List。
3. 内存分配安全问题
单线程环境中,上述两种方法可以正常分配内存。但是并发情况下,它们并不是线程安全的。那如何解决呢?
- 同步处理:对分配内存空间的动作进行同步处理,虚拟机采用CAS搭配失败重试的方式保证更新操作的原子性。
- TLAB:把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(ThreadLocal Allocation Buffer,TLAB)。线程内部创建对象时,就从自己的空间分配,只有TLAB用完工分配新的TLAB时,才需要同步锁定。
参数-XX:+/-UseTLAB可以设定虚拟机是否使用TLAB。
三、初始化零值
顾名思义,这一步就是将分配到的内存空间都初始化为零值(不包括对象头),例如int类型赋值为0,boolean类型赋值为false,引用类型赋值为null等。这样对象的成员变量就可以在没有赋值情况下使用了,只不过访问对象的成员变量都是零值。
如果使用TLAB,这一过程也可以提前至TLAB分配时进行。
四、设置对象头
这一步,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头(Object Header)之中。根据虚拟机当前的运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。
对象头相关的详情内容请参考我的另一篇文章:Java对象的内存结构。
五、执行
方法Java在编译的时候生成的,该方法包含这个类中的实例成员变量声明、实例初始化块和构造方法,作用是给对象执行初始化操作。类中有多少个构造方法就有多少个方法。创建对象时使用哪个构造方法,就执行对应的方法。方法中的语句顺序与实例成员变量初始化顺序一致,实例成员变量的初始化顺序如下:
- 父类实例成员变量声明和实例初始化块(按照声明顺序)
- 父类构造方法
- 子类实例成员变量声明和实例初始化块(按照声明顺序)
- 子类构造方法
至此,初始化操作完成,一个真正可用的Java对象才算完全创建出来了。