运行时区域
程序计数器
- 线程私有,各线程计数器互不影响,独立存储。
- 程序计数器是一块较小的空间,它可以看作是当前线程所执行的字节码的行号指示器(地址)。在虚拟机的概念模型里,字节码解释器工作时是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支,循环,跳转,异常处理,线程恢复等基础功能都需要依赖这个计数器来完成。
- 如果执行的是native方法,这个计数器的值为空
Java虚拟机栈
- 线程私有的,生命周期与线程相同。
- 虚拟机栈描述的是Java方法自行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每个方法从调用直至执行完成的过程,就对应这一个栈帧在虚拟机栈中入栈到出栈的过程。
- 局部变量表存放了编译期可知的各种基本类型(boolean、byte、char、short、int、float、double、long)、对象引用(reference类型,它不等同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和returnAddress类型(指向了一个条字节码指令的地址)
- 其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。局部变量表所需的内存空间在编译期完成分配,当进入一个方法时,这个方法需要再栈中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表大小。
- 会抛出OutOfMemoryError和StackOverflowError
本地方法栈
- 本地方法栈与虚拟机栈所发挥的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到Navative方法服务。
- 会抛出OutOfMemoryError
Java堆
- 线程共享
- Java堆是Java虚拟机所管理的内存中最大的一块
- 唯一目的就是存放对象实例,几乎所有的的对象实例都在这里分配内存,所有的对象实例以及数组都要在堆上分配
- 随着JIT编译器的发展与逃逸分析技术的逐渐成熟,所有的对象都分配在堆上也逐渐变得不是那么绝对了。
- 内存区域分为新生代和老年代
- 可能会存在有线程私有的缓冲区,Thread Local Allocation Buffer,以提升对象分配时的效率
- 会抛出OutOfMemoryError和StackOverflowError
方法区
- 线程共享
- 用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
- 运行时常量池是方法区的一部分,用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
- 当常量池无法再申请内存时会跑出OutOfMemoryError
- 自JDK7起,使用永久代实现的方法区的字符串常量池迁移到堆中,并在JDK8使用元空间代替永久代,使用垃圾回收方法区的内存空间,方法区就会很少报内存溢出。
直接内存
- 不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。
- 在JDK1.4新加入了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。这样能再一些场景中显著提高性能,因为避免了在Java堆中和Native堆中来回复制数据。
- 会抛出OutOfMemoryError
HotSpot虚拟机对象探秘
深入探究HotSpot虚拟机在Java堆中对象分配、布局和访问的全过程
对象的创建
对象的复制,反序列化,或通过new关键字声明对象实例
- 当Java虚拟机遇到一条字节码new指令时,首先会去检查这个指令的参数是否能再常量池中定位到一个符号引用,并且检查这个符号引用代表的类是否以被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。
- 在类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需的内存在类加载完成后便可完全确定,为对象分配空间的任务实际上变等同于把一块确定大小的内存在Java堆中划分出来。
- 分配内存的方式
- 指针碰撞,Java堆中的内存时规整的,使用指针作为分分界点的指示器把空闲和已分配的内存分隔开,分配内存只需把指针向空闲方向挪动一段与对象大小相等的距离。在并发的情况下,可能同时给对象A和对象B分配内存,同时使用原来的指针来分配内存,解决方案: 一种是对分配内存空间的动作进行同步处理-实际上虚拟机是采用CAS配上失败重试的方式保证更新操作的原子性;另外一种是是把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中预先分配一小块内存,成为本地线程分配缓存(Thread Local Allocation Buffer ,TLAB),就在哪个线程的本地缓冲区中分配,只有本地缓冲区用完了,分配新的缓存区时才需要同步锁定。
- 空闲列表,Java堆中的内存不规整,使用列表记录空闲的内存块。
- 内存分配完成之后,虚拟机必须将分配到的内存空间(但不包括对象头)都初始化为零值,如果使用了TLAB的话,这一项工作也可以提前在TLAB分配时进行。这步操作保证了对象的实力字段在Java代码中可以不赋初始值就直接使用,使程序能访问到这些字段的数据类型所对应的零值。
- 设置对象头(Object Header)信息,类的元数据信息,对象的哈希值,对象的GC分代年龄等信息。根据虚拟机当前运行状态的不同,如是启用偏向锁等,对象头会有不同的设置方式。
- 执行构造方法,即Class文件中的()方法还没有执行,所有的字段都为默认的零值。
对象的内存布局
对象在堆内存中的存储布局可以划分我三个部分:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)。
- 对象头
- 运行时数据,哈希吗、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。这部分数据在32位和64位的虚拟机中,分别为32个比特和64个比特,官方称它为“Mark Word”。
- 类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。并不是所有的虚拟机实现都必须在对象数据上保留类型指针,换句话说,查找对象的元数据信息并不一定通过对象本身。
- 如果对象是数组,还必须有一块用于记录数组长度的数据。
- 对象实例数据部分,即我们在程序代码里面所定义的各种类型的字段内容,无论是从父类继承下来的,还是在子类中定义的字段都必须记录起来,这部分的存储顺序会受到虚拟机分配策略参数(-XX:FieldsAllocationStyle参数)和字段在Java源码中所定义的顺序的影响。+XX:CompactFileds参数为true(默认为true),那子类之中较窄的变量也允许插入父类变量的空隙之中,以节省出一点点空间。
- 对齐填充,这并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。由于HotSpot虚拟机的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是任何对象的打大小都必须是8字节的整数倍。
对象的访问定位
Java程序通过栈上的reference数据来操作堆上的具体对象。对象的访问方式实现由虚拟机而定,主流的访问方式主要有使用句柄和字节指针两种。
- 句柄,Java堆中将可能划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据和类型数据各自具体的地址信息。
- 优势:对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例指针地址,而reference本身不需要被修改
- 直接指针,Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关信息,reference中存储的直接就是对象地址、如果只是访问对象本身的话,就不需要多一次间接访问的开销。
- 优势:速度更快