虚拟机遇到一个new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载,解析和初始化过。如果没有那必须先执行相应的类的加载。在类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后便可以完全确定,为对象分配空间的任务等同于把一块确定大小的内存从JAVA堆中划分出来,假设JAVA堆中的内存是绝对规整的,所有用过的内存放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针想空闲空间那边挪动一段与对象大小相等的距离,这种分配方式称为“指针碰撞”。如果JAVA堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,那就没有办法简单地进行指针碰撞了,虚拟机就必须维护一个列表,记录上拿些块是可用的,在分配的时候从列表中找到一块足够大的空间分给对象实例,并更新列表上的记录,这种分配方式称为“空闲列表”。
除如何划分可用空间之外,还有一个需要考虑的问题是对象创建在虚拟机中是非常频繁的行为,即使是修改一个指针所指向的位置,在并发的情况下也不是线程安全的,可能出现正在给对象A分配内存,指针还没来的及修改,对象B又同时使用了原来的指针来分配内存的情况。解决这个问题有两种方案,一种是对分配内存空间的动作进行同步处理--实际上虚拟机采用CAS配上失败重试的方式保证更新操作是原子性;另一种是把内存分配的动作按照线程划分在不同的空间进行,即每个线程在JAVA堆预先分配一小块内存,称为本地线程分配缓存(Thread Local Allocation Buffer,TLAB)。哪个线程需要分配内存,就在哪个线程上的TLAB上分配,只有TLAB用完并分配新的TLAB时才需要同步锁定。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定。
内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),如果使用TLAB,这一工作过程也可以提前至TLAB分配时进行。这一步操作保证了对象实例字段在JAVA代码中可以不赋值初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。
接下来,虚拟机需要对对象进行必要的设置,例如这个对象是哪个类的实例,如何才能找类的元数据信息,对象哈希码,对象的GC分代年龄等信息。这些信息存放在对象的对象头之中。
在上面工作都完成之后,从虚拟机的视角看,一个新的对象已经产生了。但是从JAVA程序视角看,对象创界才刚刚开始---<init>方法还没有执行,所有字段都还为零。所以一般来说,执行new指令之后会接着执行<init>方法,把对象按照程序员的意愿进行初始化,这样一个对象才算完全产生出来。