Java是一门面向对象的编程语言,Java程序每时每刻都有对象被创建出来。在语言层面上,创建对象通常仅仅通过一个new关键字即可。当然还包括复制、反序列化等。而在虚拟机中,对象是如何创建的呢?让我们先初略的探索一下。
- 当Java虚拟机遇到一条字节码new指令时,首先会去检查指令的参数是否能在常量池中定位到一个类的符号引用,并检查这个符号应用的代表类是否已经被加载、解析和初始化过。如果没有则执行响应的类加载过程。
- 当类加载完成后,接下来虚拟机会为新生的对象分配内存。对象所需的内存大小在类加载完之后便可完全确认,为对象分配空间的任务实际上等同于把一块确定大小的内存块从java堆中划分出来。
- 从堆中划分内存块的方式有两种:
A、如果Java堆内存是绝对规整的,所有被使用过的内存都放一边,空闲的内存放另一边,中间放一个指针作为分界点的指示器,那么所分配内存就是把指针向空闲空间方向挪一段与对象大小相等的距离。这种分配方式叫做“指针碰撞”。
B、如果堆中的内存并不工整,已经被使用过的内存和空闲的内存项目交错在一起。那就没办法简单的进行指针碰撞了。虚拟机需要维护一个列表,记录哪些内存的可用的,在分配的时候,从列表中找一个足够大的空间划分给实例对象,并更新列表上的记录,这种分配方式为“空闲列表”。 - 选择哪种分配方式由java堆是否规整决定,而java堆是否规整又由所采用的垃圾采集器是否带有空间压缩整理的能力决定。
当使用Serial、ParNew等带压缩整理过程的收集器时,系统采用指针碰撞这种分配方式,既简单又高效。
当使用CMS这种基于清除(Sweep)算法的收集器时,理论上只能采用较为复杂的“空闲列表”来分配内存。 - “指针碰撞”看似简单,但还有一个问题需要考虑:对象创建是很频繁的行为,在并发情况下会出现线程安全问题,可能出现正在给A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存。
解决这个问题,有两种可选方案:一、对分配内存空间的动作进行同步处理。二、把内存分配的动作按照线程划分在不同空间中进行,即每个线程在Java堆中预先分配一小块内存,成为本地线程分配缓冲区(Thread Local Allocation Buffer,TLAB),哪个线程要分配内存,就在哪个线程的本地分配缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定。虚拟机是否使用了TLAB可以通过-XX:+/-UseTLAB参数来设定。 - 内存分配完成之后,虚拟机必须将分配到的内存空间进行初始化,如果使用了TLAB的话,该步骤也可以提前到TLAB分配时进行。这步操作保证了对象的实例字段在Java代码中可以不赋初始值直接使用。
- 接下来Java虚拟机还要对对象进行必要的设置。例如:这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存储在对象的对象头中。
- 上述步骤完成后,对于Java虚拟机来说,一个对象已经产生了。但是从Java程序的角度来说,对象的创建才刚刚开始——构造函数,即Class文件中的()方法还没执行,所有的字段都是默认零值,对象需要的其他资源和状态信息都还没按照预定的意图构造好。