引言:知道了虚拟机的内存情况,了解了内存中放了什么之后(还不清楚的朋友可以看我的Java虚拟机运行时的数据区域)。下一步就要知道这些区域中数据的细节,下面内容探讨的是HotSort虚拟机在Java堆中对象的分配,布局和访问的过程。
一:对象的创建
语言层面上,一个关键字new就可以创建对象。那么在虚拟机中,创建对象又是怎么的过程?
当虚拟机遇到new关键字时,首先去检查这个指令的参数能否在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有先进行相应的类加载过程。
在类加载检通过后,接下来虚拟机是为新生对象分配内存。对象所需要的内存大小在类加载后就可以确定下来,为对象分配内存,实际上就是在Java堆中划分出大小确定的内存空间。这时候又分两种情况,第一种,当Java堆中内存是一块规整的区域,所有用过的内存放在一边,没用的内存放在一边,中间一个指针作为分界点的指示器,那么分配内存就是把指针向空闲的内存移动与对象分配内存大小相等的距离,这种分配方式叫“指针碰撞”。第二种,Java堆不是规整的,已经使用的内存和空间内存是相互交错的,那么就不能用指针碰撞的方法来分配内存,必有一个列表来记录哪些内存是可用的,在分配的时候,找出一块足够大的内存空间分配给对象实例,并更新列表上的记录,这种分配方式叫“空闲列表”。选择哪种方式由Java堆是否规整决定,而Java堆是否规整又取决于所采用的垃圾收集器是否带有压缩整理功能。
划分空间固然重要,但是如果对象创建频繁,即使仅仅修改一个指针所指向的位置 ,在并发情况下也并不是安全的。比如会出现正在给对象A分配内存,还没来得及修改指针,对象B又使用了原来的指针来分配内存的情况。解决这个问题有两种方案,一是对对象分配内存空间的动作进行同步处理--实际上,虚拟机采用CAS配上失败重试的方法保证更新操作的原子性;另外一种方式是把内存分配的动作按照线程划分在不同的空间中进行,即每个线程在Java堆中预先分配一块内存,称为本地线程分配缓冲(TLAB)。那个线程要分配就在那个
线程的TLAB上。
内存分配完成后,虚拟机需要将内存空间都初始化为零值。这一步保证对象的实例字段在Java代码中不赋初始值就直接使用,且为零。
下来就是对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的gc分带年龄等信息。这些信息都放在对象的对象头之中。上面的工作完成,从虚拟机角度来看对象已经创建完成,但是从Java语言方面来看,对象的init方法还没有执行,所有字段都还为0,下来就是执行init方法。
二:对象的内存布局
所谓的对象内存布局就是描述对象在内存中怎样放置。
在HOtspot中,对象在内存中的布局可以分为三个区域:对象头,实例数据和对齐方式。
对象头又包括两部分信息,一是存储对象自身运行时的数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID等,这部分数据在32位和64位虚拟机中分别为32bit ,64bit ,官方称为“Mark Word”。另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针确定这个对象是哪个类的实例。也并不是所有的对象
数据保留类型指针。另外,如果对象是一个Java数组,那么对象头中还有一块记录数组长度的数据,因此虚拟机可以通过普通的Java对象的元数据信息来确定Java对象的大小,但是从数组的元数据中无法确定数组的大小。
接下来是实例数据,它是对象真正存储的有效信息,也是在程序代码中定义各种类型的字段内容。这部分的存储顺序会受到虚拟机分配策略参数和字段在Java源码中定义的顺序影响
Hotspot虚拟机默认的分配方式是double/long,int,short/char,byte/boolean,oops,可以看到相同宽度的字段总被分配在一起。还有就是父类定义的变量会出现在子类之前。
第三部分对齐方式仅仅起着占位符作用。内存管理系统要求对象的起始地址必须是8字节的整数倍,所以当实例数据没有对齐时,就需要通过对象填充来补全。
三:对象的访问定位
创建对象是为了使用是一个对象,通过栈上的reference类型来操作堆上的具体对象。由于reference类型只规定一个指向对象的引用,并没有定义该引用通过何种方式去定义、访问堆中对象的具体位置,所以对象的访问方式也是取决于虚拟机实现定义的。目前有两种使用句柄和直接指针的方式。
3.1句柄访问,Java堆会划分一块内存作为句柄池,reference中存储的就是句柄地址,而句柄中包含了对象的实例数据与类型数据各自的具体地址信息。优点是在对象移动时只改变句柄中实例数据指针,而reference本身不需要修改。
3.2使用指针访问,reference中存储的就是对象的地址。优点是速度快,节省了一次指针定位的时间开销。