【内存解析】-JVM

引言

原本只是想了解一下程序运行时堆栈分配空间的问题,结果看着看着,发现堆栈是JVM中东西,那JVM是什么呢?他的动能和原理有是怎样的呢?就顺便了解了一下。


 什么是JVM?

     JVM是Java Virtual Machine的缩写,通常成为java虚拟机,作为Java可以进行一次编写,到处执行(Write once, run anywhere)的平台基础,由JVM帮工程师屏蔽了不同平台的差异性,提供了一致的编写接口。

   谈到JVM,我们不得不讨论一下什么是VM(Virtual Machine),我们在工作中碰到的虚拟由VMWare, Xen, Virtual Box等提供的虚拟机解决方案,还有OpenStack的云解决方案,本质上它们都是虚拟机的技术路线,基于软件来模拟计算机硬件的指令集合,包括网卡,CPU,硬盘存储,IO设备,内存设备等等,从基于目前的软件方案充分发掘硬件设备的利用率和效能,在一台物理机器上做出若干台貌似完全的独立虚拟机器,以至于云平台出来。

   JVM本身是一套软件程序,模拟ava Class规范的字节码指令集合,从而可以进行class的加载以及执行。


Java语言规范和JVM规范

    Java语言规范是描述Java语言本身的 大纲,包括语法,词法,数据类型以及文法。 JVM规范是描述Class文件格式,JVM执行流程和指令集的。 Java语言编写的代码编译成Java Class文件格式,从而被JVM来执行,这个是两者之间的耦合点。

     但是JVM是一个平台,不仅仅支持Java语言,目前其支持众多的新型语言: Groovy, Scala(Spark的编写语言),Cloure, JPython, JRuby等,只要是编译出来的class遵守JVM的规范,即可被JVM解释执行;这个也是JVM作为一个平台,与Java语言独立发展的源动力,随着后续JVM性能的提升以及平台稳定,也给不同的新语言提供了运行平台,从而导致了百花齐放般的JVM 语言出现。

    JVM的数据类型与Java语言规范中的数据类型并不一致,其中很多的数据类型更侧重于底层字节和数据的解释执行。

    JVM中有堆(Java Object分配空间),栈(线程执行区域),方法区, PC(Program Counter)程序计数器等组成,除了上面提到了指令集合,加载顺序以及解释执行顺序等。

   JVM是独立于Java语言的一套规范以及一个Class解释执行的平台软件,以其性能精良、稳定高效,赢得了大型应用的亲睐,我们讲逐步深入其中了解更多的JVM内容


Java程序具体执行的过程

        由于Java程序是交由JVM执行的,所以我们在谈Java内存区域划分的时候事实上是指JVM内存区域划分。在讨论JVM内存区域划分之前,先来看一下Java程序具体执行的过程:

        如上图所示,首先Java源代码文件(.java后缀)会被Java编译器编译为字节码文件(.class后缀),然后由JVM中的类加载器加载各个类的字节码文件,加载完毕之后,交由JVM执行引擎执行。在整个程序执行过程中,JVM会用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为Runtime Data Area(运行时数据区),也就是我们常说的JVM内存。因此,在Java中我们常常说到的内存管理就是针对这段空间进行管理(如何分配和回收内存空间)。


JVM运行时数据区域划分

        在知道了JVM内存是什么东西之后,下面我们就来讨论一下这段空间具体是如何划分区域的。Java虚拟机在执行Java程序的过程中会把它管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途,根据 Java虚拟机规范的规定,虚拟机所管理内存会被分为如下图所示的几个区域:

程序计数器

程序计数器(Program Counter Register),也有称作为PC寄存器。想必学过汇编语言的朋友对程序计数器这个概念并不陌生,虽然JVM中的程序计数器并不像汇编语言中的程序计数器一样是物理概念上的CPU寄存器,但是JVM中的程序计数器的功能跟汇编语言中的程序计数器的功能在逻辑上是等同的,也就是说是用来指示 执行哪条指令的

Java栈

Java栈也称作虚拟机栈(Java Vitual Machine Stack),也就是我们常常所说的栈。事实上,Java栈是Java方法执行的内存模型。为什么这么说呢?下面就来解释一下其中的原因。

Java栈中存放的是一个个的栈帧,每个栈帧对应一个被调用的方法,在栈帧中包括局部变量表(Local Variables)、操作数栈(Operand Stack)、指向当前方法所属的类的运行时常量池(运行时常量池的概念在方法区部分会谈到)的引用(Reference to runtime constant pool)、方法返回地址(Return Address)和一些额外的附加信息。当线程执行一个方法时,就会随之创建一个对应的栈帧,并将建立的栈帧压栈。当方法执行完毕之后,便会将栈帧出栈。因此可知,线程当前执行的方法所对应的栈帧必定位于Java栈的顶部。讲到这里,大家就应该会明白为什么 在 使用 递归方法的时候容易导致栈内存溢出的现象了以及为什么栈区的空间不用程序员去管理了(当然在Java中,程序员基本不用关系到内存分配和释放的事情,因为Java有自己的垃圾回收机制),这部分空间的分配和释放都是由系统自动实施的。对于所有的程序设计语言来说,栈这部分空间对程序员来说是不透明的。下图表示了一个Java栈的模型:

局部变量表,顾名思义,想必不用解释大家应该明白它的作用了吧。就是用来存储方法中的局部变量(包括在方法中声明的非静态变量以及函数形参)。对于基本数据类型的变量,则直接存储它的值,对于引用类型的变量,则存的是指向对象的引用。局部变量表的大小在编译器就可以确定其大小了,因此在程序执行期间局部变量表的大小是不会改变的

操作数栈,想必学过数据结构中的栈的朋友想必对表达式求值问题不会陌生,栈最典型的一个应用就是用来对表达式求值。想想一个线程执行方法的过程中,实际上就是不断执行语句的过程,而归根到底就是进行计算的过程。因此可以这么说,程序中的所有计算过程都是在借助于操作数栈来完成的

指向运行时常量池的引用,因为在方法执行的过程中有可能需要用到类中的常量,所以必须要有一个引用指向运行时常量。

方法返回地址,当一个方法执行完毕之后,要返回之前调用它的地方,因此在栈帧中必须保存一个方法返回地址。

由于每个线程正在执行的方法可能不同,因此每个线程都会有一个自己的Java栈,互不干扰。

本地方法栈

本地方法栈与Java栈的作用和原理非常相似。区别只不过是Java栈是为执行Java方法服务的,而本地方法栈则是为执行本地方法(Native Method)服务的。在JVM规范中,并没有对本地方发展的具体实现方法以及数据结构作强制规定,虚拟机可以自由实现它。在HotSopt虚拟机中直接就把本地方法栈和Java栈合二为一。

在C语言中,堆这部分空间是唯一一个程序员可以管理的内存区域。程序员可以通过malloc函数和free函数在堆上申请和释放空间。那么在Java中是怎么样的呢?

Java中的堆是用来存储对象本身的以及数组(当然,数组引用是存放在Java栈中的)。只不过和C语言中的不同,在Java中,程序员基本不用去关心空间释放的问题,Java的垃圾回收机制会自动进行处理。因此这部分空间也是Java垃圾收集器管理的主要区域。另外,堆是被所有线程共享的,在JVM中只有一个堆。

方法区

方法区在JVM中也是一个非常重要的区域,它与堆一样,是被线程共享的区域。在方法区中,存储了每个类的信息(包括类的名称、方法信息、字段信息)、静态变量、常量以及编译器编译后的代码等

在方法区中有一个非常重要的部分就是运行时常量池,它是每一个类或接口的常量池的运行时表示形式,在类和接口被加载到JVM后,对应的运行时常量池就被创建出来。当然并非Class文件常量池中的内容才能进入运行时常量池,在运行期间也可将新的常量放入运行时常量池中,比如String的intern方法。


结语

程序运行内存分配是原理性的知识,我们有必要了解。JVM第一次接触,借着网络初步有了一些了解,期待大家的指正。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

木子松的猫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值