JVM之 运行时数据区和常用指令集

复制自 深入理解Java虚拟机(一)-jvm运行时数据区

jvm运行时数据区域
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,已经创建和销毁时间,有的区域随着虚拟机进程的启动而创建,有些区域则依赖用户线程的启动和结束而创建和销毁。根据《Java虚拟机规范(Java SE 7)》的规定,Java虚拟机所管理的内存将会包括以下几个运行时数据区域,如下图所示:


1、程序计数器
程序计数器(Program Counter Register)是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令、分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。

由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的。在任何一个确定的时刻,一个处理器都只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各个线程之间计数器互不影响,独立存储。

如果线程正在执行的是一个Java方法,那这个计数器记录的是正在执行的字节码指令的地址;如果正在执行的是Native方法,这个计数器值则为空(undefined)。
此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。

程序计数器是线程私有的,它的生命周期与线程相同(随线程而生,随线程而灭)。

2、Java虚拟机栈
虚拟机栈(Java Virtual Machine Stack)描述的是Java方法执行的内存模型:每个方法被执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从被调用直至执行完成的过程就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

在Java虚拟机规范中,对这个区域规定了两种异常情况:
如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;
如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可以扩展),如果扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。

与程序寄存器一样,java虚拟机栈也是线程私有的,它的生命周期与线程相同。

3、本地方法栈
本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是非常类似,它们之间的区别在于虚拟机栈为虚拟机执行Java方法服务,而本地方法栈则是为虚拟机使用到的Native方法服务。在虚拟机规范中对本地方法栈中方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由的实现它。

与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。

与虚拟机栈一样,本地方法栈也是线程私有的。

4、Java 堆(Java Heap)
对于大多数应用来说,Java 堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。Java 堆是被所有线程共享的一块内存区域,在虚拟机启动的是创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例以及数组都要在这里分配内存。

Java堆是垃圾收集器管理的主要区域,因此很多时候也被称为“GC堆”(Garbage Collected Heap)。从内存回收的角度来看,由于现在收集器基本都采用分代收集算法,所以Java堆还可以细分为:新生代和老年代;新生代又可以分为:Eden 空间、From Survivor空间、To Survivor空间。

根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过-Xms和-Xmx控制)。如果在堆中没有内存完成实例的分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。

5、方法区(Method Area)
方法区(Method Area)和Java堆一样,是各个线程共享的内存区域,它用于存放已被虚拟机加载的类信息、常量、静态变量、JIT编译后的代码等数据。方法区在虚拟机启动的时候创建。

Java虚拟机规范对方法区的限制非常宽松,除了和堆一样不需要不连续的内存空间和可以固定大小或者可扩展外,还可以选择不实现垃圾收集。

根据Java虚拟机规范的规定,如果方法区的内存空间不能满足内存分配需要时,将抛出OutOfMemoryError异常。

6、运行时常量池
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

7、直接内存
直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。但是这部分内存也被频繁使用,而且也可能导致OutOfMemoryError异常出现。

在JDK 1.4 中新加入了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/O方法,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中DirectByteBuffer对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为避免了在Java堆和Native堆中来回复制数据。

 

线程和以上概念的关系:

 

 

线程独有的: PC(记录了线程执行的位置)VMS(虚拟机栈)NMS(本地方法栈) 

JVM栈中存放了一个个的栈帧,每个栈帧就对应一个执行的方法。

栈帧中有Local Variables(本地变量/局部变量),Operand Stacks(操作数栈,每个栈帧里还有一个私有的栈),dynamic linking(动态链接),return address(下一步运行的地址,一个栈帧完了,线程还需要继续运行下去,用这个来找到下一条指令)


了解了runtime data area后,看一道面试题:

答案为什么是8。

分析编译后的java汇编指令:(要查看编译后的Java汇编指令,可以用idea的JClassLib插件,再view->show bytecodes with JClassLib)

bipush 8 将8压入操作数栈

istore_1 将栈顶出栈,赋值给i

iload_1 将i的值入栈

iinc 1 by 1 将i+1,这个操作是在local variable里完成的,官方解释:

istore_1 将栈顶元素出栈,赋值给local variables下标为1的变量

从以上几句指令可以看出,i的值还是8

后面的invokevirtual表示调用print方法,打印栈里刚load的8

最后return,会返回一个地址,用于执行下一个指令。

一个问题,为什么istore iload后面的参数都是1?最开始不应该只有一个参数吗 下标应该是0?

看一下local variable 里的数据

可以看到 第一个index为0的地方,已经放了一个这个方法的参数了。

扩展:

分析一下上图main方法里的指令

首先是new,new表示在内存中划分出一块区域,并赋默认值,查看new的官方文档,发现还会把这个对象的引用给压栈

 再是dup(duplicate复制)

dup表示复制当前栈顶的值,并压栈,这样栈里是2个新对象的引用

再是调用构造方法,invokespecial需要传入一个栈顶的值,就是新对象的引用,然后将对象进行初始化

最后istore_1 ,现在栈里一个新对象的引用(上面那个调用构造方法时出栈了),表示将这个引用赋值给h

 这就是从指令层面解释就是new一个对象的全过程。也能解释DCL单例模式为什么要用volatile了,因为new一个对象,中间还有好几步操作,有半初始化的一个状态。

之后iload_1 ,又将h入栈

再是invokevirtual 调用h.m1()方法

这里也能从指令层面,解释《Think in Java》中的那句“方法调用时,会隐形的传入一个被调用实例的引用值,然后在方法中就用this获取”(ps:记不清了,大概就这意思)(pps,只有当调用static方法的时候不需要传,因为static方法不需要实例)

 

分析有返回值的方法调用:

 m1方法先是100压栈,然后ireturn,查看ireturn的文档,将当前栈里的值出栈,并压入调用者栈帧的操作数栈中:

 

 main方法的操作数栈此时已经有h、100

instore_2这里就是把栈顶给弹出赋值给localvariable里的i

最后return

 

 

总结一下常用的指令

store

load

pop

mul

sub

invoke

1. InvokeStatic
2. InvokeVirtual
3. InvokeInterface
4. InovkeSpecial
   可以直接定位,不需要多态的方法
   private 方法 , 构造方法
5. InvokeDynamic
   JVM最难的指令
   lambda表达式或者反射或者其他动态语言scala kotlin,或者CGLib ASM,动态产生的class,会用到的指令

关于栈帧里的执行过程可以参考这篇,写得比我清晰多了

https://www.cnblogs.com/kesan/p/11368934.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值