对象的创建
-
当Java虚拟机遇到一条字节码new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号元素,并且检查这个符号引用代表的类是否已被加载、解析和初始化过
- 如果没有,则先执行相应的类加载过程
-
类加载检查通过后,虚拟机为新生对象分配内存
- 对象所需内存的大小在类加载完成后变可确定
- 把一块确定大小的内存块从Java堆中划分出来
- 分配方式有
指针碰撞
和空闲列表
两种- 选择哪种分配方式由 Java 堆是否规整决定
- Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定
- Java 堆内存是否规整,取决于 GC 收集器的算法是"标记-清除",还是"标记-整理"、复制算法
- 在实际开发过程中,创建对象是很频繁的事情,作为虚拟机来说,必须要保证线程是安全的
- 虚拟机采用两种方式来保证线程安全
CAS+失败重试
: 虚拟机采用 CAS 配上失败重试的方式保证更新操作的原子性。TLAB
: 每个线程在Java堆中预先分配一小块内存(本地线程分配缓冲/TLAB),首先在TLAB分配,当TLAB用尽时,再采用上述的CAS进行内存分配
- 虚拟机采用两种方式来保证线程安全
-
内存分配完成之后,虚拟机必须将分配到的内存空间(但不包括对象头)都初始化为零值
- 保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,使程序能访问到这些字段的数据类型所对应的零值
-
Java虚拟机还要对对象进行必要的设置
- 例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄、是否使用偏向锁等,这些信息都存放到
对象头
中
- 例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄、是否使用偏向锁等,这些信息都存放到
-
完成上述工作以后,从虚拟机的角度,一个新的对象已经生成。但是从Java程序的角度,对象创建才刚刚开始——执行Class文件中的
<init>()
- new指令之后执行
<init>()
,按程序员的意愿对对象进行初始化
- new指令之后执行
对象的内存布局
对象在堆内存的存储布局有三部分:对象头、实例数据、对齐填充
对象头
- 对象头包括两类信息
- 第一类是用于存储对象自身的运行时数据
- 如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等
- 官方称之为
Mark Word
,它有着动态定义的数据结构,根据对象的状态服用自身存储空间
- 第二是类型指针,即对象指向它的类型元数据的指针
- Java虚拟机通过这个指针来确定该对象是哪个类的实例
- 如果对象是一个数组,对象头中还必须有一块用于记录数组长度的数据
- 因为虚拟机可以通过普通对象的元数据信息确定其大小,但如果数组的长度是不确定的,将无法通过元数据信息确定其大小
- 第一类是用于存储对象自身的运行时数据
实例数据
- 对象真正存储的有效信息,即代码中定义的字段内容
- 无论是父类继承下来的,还是子类中定义的字段都必须记录起来
对齐填充
仅仅起到占位符的作用,保证了对象的大小是8字节的整数倍
对象的访问定位
- Java程序会通过栈上的
reference
数据来操作堆上的具体对象 - 对象访问方式由虚拟机实现而定
- 主流的访问方式主要用
句柄
和直接指针
两种
句柄访问
Java堆中划分出一块内存作为句柄池,reference
中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自具体的地址信息
直接指针访问
reference
中存储的技术对象地址
Java堆中对象的内存布局必须考虑如何放置访问类型数据的相关信息
优劣
句柄访问的最大好书就是reference
中存储的是稳定句柄地址,在对象被移动时(垃圾收集中的普遍行为)只会改变句柄中的实例数据指针,而reference
本身不需要修改。
直接指针访问的最大好处就是速度更快,节省了一次指针定位的开销。
HotSpot虚拟机主要使用直接指针进行对象访问。
参考文献:《深入理解Java虚拟机》