对象的创建
Java中对象的创建十分频繁,在语言层面上通常使用new关键字去创建对象,但是在虚拟机中创建对象就不是这么简单了。
大体可以分为以下四步:
类加载检查
当执行一条new指令时,首先会检查这个指令参数能否在常量池中找到一个类的符号引用,并检查这个符号引用类有没有是否已经被加载、解析和初始化过。如果没有,就进行相应的类加载过程。类加载检查通过后,对象所需的内存的大小在类加载过程中就可以确定,就可以在虚拟机中为新生对象分配内存。
分配内存空间
在堆中分配空间就是在堆中将一块确定大小的内存在堆中划分出来,主要有两种分配方式:指针碰撞和空闲列表,选择哪种分配方式是由java堆是否规整来决定的,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理的功能决定。因此,在使用Serial、ParNew等带有压缩整理功能,系统采用的分配算法是指针碰撞,使用CMS这种通常采用空闲列表。
- 指针碰撞
如果Java堆都是规整的,用过的内存在一边,没有用过的内存在另一边,中间放着指针作为分界点的指示器。分配内存空间就是将指针向空闲区方向移动一段与占用的内存空间相等的距离。
- 空闲列表
如果Java堆不是规整的,使用过的内存和未使用的内存相互交错,此时虚拟机就必须维护一个列表,记录未使用的内存。分配空间就是在列表中找到一块足够大的内存区域分为对象实例。更新列表的状态就可以了。
并发情况下如何保证正确分配内存?
在并发情况下仅仅修改指针的位置并不是线程安全的,可能正在给对象A分配空间,而指针还没有来的及修改,此时对象B也需要分配内存空间,可能会在原来的指针位置上进行内存分配。解决这种问题有两种方法:
- 对分配内存空间动作进行同步处理——实际上虚拟机采用CAS配上失败重试的方法保证更新操作的原子性。
- 把内存分配动作按照不同的线程划分在不同的空间中,每个线程在Java堆中预留一小块内存空间,称为本地线程分配缓存(TLAB),哪个线程需要分配内存,就在哪个线程上的TLAB上分配,当TLAB用完需要分配新的TLAB空间时,才需要同步锁定。
初始化为“零值”
分配空间完成后,虚拟机将分配到的内存空间都初始化为零值(不包括对象头),如果使用了TLAB,这一过程也可以在TLAB分配时进行,保证了java代码中没有进行初始化也可以使用对应数据类型的零值。
进行配置
虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头之中。根据虚拟机当前的运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。
根据代码进行初始化
执行方法,对象按照程序员的意愿进行初始化。
内存布局
对象在内存中的储存布局可以分为以下三个部分:对象头、实例数据和对其填充。
- 对象头:
主要分为两个部分:
一部分用于储存对象自身的运行时数据,如:哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
另一部分为类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。并不是所有的虚拟机实现都必须在对象数据上保留类型指针(查找对象的元数据信息不一定要经过对象本身)。
需要注意的是,如果对象是Java数组,对象头中还应保存数组的长度。
- 实例数据:
程序代码中所定义的各种类型的字段内容。无论是从父类继承下来的,还是在子类中定义的,都需要记录起来。
- 对齐填充
HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说,就是对象的大小必须是8字节的整数倍。而对象头部分正好是8字节的倍数(1倍或者2倍),因此,当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。
访问定位
建立对象是为了使用对象,我们的Java程序需要通过栈上的reference数据来操作堆上的具体对象。由于reference类型在Java虚拟机规范中只规定了一个指向对象的引用,并没有定义这个引用应该通过何种方式去定位、访问堆中的对象的具体位置,所以对象访问方式也是取决于虚拟机实现而定的。目前主流的访问方式有使用 句柄 和 直接指针 两种。
- 句柄访问 :reference中储存的是对象的句柄地址。
- 优点:当对象被移动时(比如进行垃圾收集),不需要修改reference中储存的信息,只修改句柄中的实例数据指针即可。
- 直接指针访问 :reference中储存的直接就是对象地址。
- 优点:速度更快,减少了一次指针定位的时间开销。对于Sun HotSpot而言,使用此种方式进行对象访问的。