JVM之运行时数据区域介绍---以在堆中对象创建、布局、访问的过程为例

前言

全文共分为两部分部分,分别为java运行时数据区域和分析在堆中对象创建、布局、访问的过程。参考资料《深入理解JAVA虚拟机》作者周志明,基于JDK1.7。

一、java运行时数据区域

运行时数据区域是指JVM在执行JAVA程序时会把它所管理的内存划分为若干个不同的数据区域,如下图:
java运行时数据区域
其中方法区与堆这两块内存随着虚拟机进程的启动而存在,整个程序结束而收回,而诸如虚拟机栈、本地方法栈、程序计数器这些区域则随着用户线程的启动和结束而创建和销毁。
换句话说,方法区和堆是所有线程共有的数据区,而其他则是线程私有的。

1.程序计数器(Program Counter Register)

它是一块较小的内存,可以看做当前线程所执行的字节码的行号指示器。
字节码解释器就是通过改变它的值来选取下一条需要执行的字节码指令,分支、循环跳转、异常处理、线程恢复等基础功能都是依靠它的。

程序计数器是线程私有的原因

由于JVM是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器都只会执行一条线程的指令。所以,为了线程切换后能够恢复到正确的执行位置,每条线程都需要一个独立私有的程序计数器。
注:如果线程执行的是一个JAVA方法,计数器指向字节码指令地址;如果是Native方法,它的值为Undefined。

2.JAVA虚拟机栈(JAVA Virtual Machine Stack)

首先JAVA虚拟机栈和程序计数器一样,是线程私有的。它的概念模型大概如下:
方法栈
可以看到虚拟机栈的基本单位是栈帧(Stack Frame),对于一个线程来说它的每一个需要执行的方法就对应着它私有虚拟机栈的栈帧一个方法的调用开始与结束就对应着一个帧入栈、出栈。
栈帧包括里面包括了:局部变量表、操作数栈、动态链接、方法出口等信息
其中局部变量表存放了编译期可知的各种基本数据类型、引用类型。局部变量表在方法入栈(即创建帧)的时候就是完全确定的了,在方法执行期间不会有任何的改变。
如果栈深大于虚拟机允许的深度,抛出StackOverflowerError异常;如果虚拟机允许虚拟机栈动态扩展(就是这部分的内存增大),当申请的空间无法满足就会抛出OutofMemoryError异常。

3.本地方法栈(Native Method Stack)

本地方法栈与虚拟机栈类似,不同是这里存放的是虚拟机使用的Native方法。和上面一样,也是线程私有的。不做过多介绍,有兴趣请另行百度。

4.JAVA堆(JAVA Heap)

java堆是JVM所管理的内存中最大的一块内存。和上面不一样的是,java堆是所有线程共享的。java堆的唯一目的就是存放对象实例(包括数组)。它的模型大致如下。

java堆
有图可以清楚看到,堆分为新生代(Young/New)以及老年代(Old/Tenured),这样分是因为现在的垃圾收集器都采用分代收集算法。
再往下细分,可以看到,新生代细分为Eden空间、Survivor 1 空间,Survivor 2空间,其中他们的比例大多默认为8:1:1.。
由于堆用于存储对象,大家可以想象到在运行期间这部分的空间肯定会被频繁申请与释放,虽然它在逻辑上是连续的,但是在物理上其实是不连续。为了解决这个分配问题,所以堆是垃圾回收的主要区域,也是内存分配的重点区域。

5.方法区(Method Area)

细心的人可能一经发现,上图中还有一部分名为Non Heap Memory的空间,这部分空间就是方法区。它用于储存被JVM加载的类信息、常量、静态常量、即使编译期编译后的代码数据。
在HotPot虚拟机中这部分空间也被称为永久代。
方法区中还包括运行时常量池。Class文件中除了有类的版本、字段、方法、接口、等描述信息外,还有一项名为常量池的信息将会在类加载的时候存入方法区中。

二、 在堆中对象创建、布局、访问的过程

在简单的了解了java运行时数据区域之后,现在我们通过在堆中对象创建、布局、访问的过程为例,加深对它的理解。

1.对象的创建

对象的创建过程可以简略归纳为下面的图:
对象创建过程

关于为对象分配内存

为对象分配内存即把一块大小确定的内存从JAVA堆中划分给该类。这里有两种分配方式。

  • 指针碰撞(Bump the Pointer)
    假如堆中的内存是绝对规整的,用过的内存在一边,未用过的在另外一边,中间放着一个指针作为分界点的指示器,那分配内存就是把指针向空闲空间那部分移动一段与对象大小相等的距离。

  • 空闲列表(Free List)
    若堆中内存不规整,无法进行简单的指针碰撞,虚拟机就必须维护一个列表,上面记录哪些内存是可用的,在分配的时候依照表上的数据,划分一块合适的内存给对象。并更新该表。
    注:至于选择那种方式取决于垃圾收集器是否带有压缩整理功能。

关于并发状态下分配内存的指针指向问题。

在并发情况下,多个线程同时对指针进行修改(因为都要新建对象)的话,这是不安全的。比如线程A正在给一个新对象分配内存,而线程B这个时候获得运行时间也创建新对象,A还没来得及进行指针修改,B就使用了原来的指针进行内存分配。
为了解决这个问题,虚拟机有两个解决方案:

  • 采用CAS配上失败重试方法保证更新操作的原子性。
  • 使用本地线程分配缓存(Thread Local Allocation Buff)
    即预先为每个线程分配一块小内存,每个线程在自己的本地缓存上进行分配,不够再申请。

2.对象的内存布局

在经历对象的创建之后,在堆中已经有了一块储存该对象的内存了。那这一块内存是怎么样的呢,这就是对象的内存布局。看图:
对象的内存布局
可以看到,对象在内存中的布局分为三部分:对象头(Header)、实例数据(Instance Data)、对齐填充(Padding)。

  • 对象头

对象头包括两部分信息:Mark Word和类型指针。
Mark Word 储存对象自身运行时的数据,如哈希码,GC分代年龄、锁状态标志、线程持有锁、偏向线程ID、偏向时间戳等。在32位和64位虚拟机中大小分别为32bit和64bit。
类型指针 即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例(如果是数组还需要一块记录长度的内存)。

  • 实例数据

实例数据部分是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容。
这部分的存储顺序会受到虚拟机分配策略参数(FieldsAllocationStyle)和字段在 Java 源码中定义顺序的影响。

  • 对齐填充

对齐填充不是必然存在的,没有特别的含义,它仅起到占位符的作用。
由于 HotSpot VM 的自动内存管理系统要求对象起始地址必须是 8 字节的整数倍,也就是说对象的大小必须是 8 字节的整数倍。对象头部分是 8 字节的倍数,所以当对象实例数据部分没有对齐时,就需要通过对齐填充来补全。

3.对象的访问

我们现在经历了对象的创建,也知道了对象在堆中内存的布局。那接下便是如何使用该对象,也就是访问对象。一句话概括:java的对象访问是通过栈上的reference数据来操作堆上的具体对象的。
对于引用(reference)的实现,目前有两种方式:

  • 使用句柄
    句柄
    使用句柄的方式堆中会分配一部分内存用作句柄池,reference引用的是句柄池中的指针,通过指针找到对象的数据。
    这种方式的优点是如果对象被移动(进行垃圾回收的时候)只需要改变句柄池中的指针,不需要改变reference。缺点是访问速度比直接指针慢,因为他需要进行两次指针定位。

  • 直接指针
    直接指针
    直接指针就是reference指向的就是对象地址,可以直接访问对象的实例数据。
    优点是访问速度快,缺点就是对象移动,reference需要修改。

总结

相信通过上面关于java运行时数据区域的介绍以及对对象创建、布局、访问的过程的简单的分析,大家对在JVM中一个对象的诞生和对象在内存中的布局有了大概的模型。以上。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值