JVM内存结构
写在开头
面试的时候遇到了一道题,给你一百个中文的key和一百个中文的value存入哈希表,该数据结构所占内存应该为多大?如果是你你会怎么回答呢,问题很小但是设计的内容可以说还比较丰富,作为一个引子,我们来探讨一下JVM的内存结构,这个问题会在另一篇文章中解答或者你们可以直接谷歌/百度。
JVM内存结构布局
Java内存模型 | |||||
堆(Heap) | 方法区(PermGen) | 栈(Threads) | |||
年轻代 | 老年代 | ||||
Eden空间 | From Survivor空间 | To Survivor空间 |
JVM内存结构主要有三大块:堆内存、方法区和栈。堆内存是JVM中最大的一块由年轻代和老年代组成,而年轻代内存又被分成三部分,Eden空间、From Survivor空间、To Survivor空间,默认情况下年轻代按照8:1:1的比例来分配;
方法区存储类信息、常量、静态变量等数据,是线程共享的区域,为与Java堆区分,方法区还有一个别名Non-Heap(非堆);栈又分为java虚拟机栈和本地方法栈主要用于方法的执行。
JVM参数
我们在运行java的时候可以通过指定各种参数来控制各个区域的内存大小,这里我也记不得。。。
搬了一张图介绍
老年代的参数不可以直接设置,但是可以设置堆空间大小和新生代空间大小两个参数来间接控制。
JVM和系统调用之间的关系
区域的作用
下面简单介绍一下内存模型中每个区域的作用:
堆 Heap
Heap是jvm管理内存中最大的一块,而且被所有的线程共享,在虚拟机创建的时候被启动,所以这块区域存放的是对象实例,几乎所有的对象实例都是在这里被分配内存。
这里也是GC发生的高频区域,这也是“GC堆”的由来,从GC的角度,现在基本上都是分代回收算法,所以JAVA堆中可细分为:新生代(Young Generation)和老生代(Old/Tenured Generation)
而新生代又可以分为Eden、From Survivor、To Survivor等,有兴趣可以找找GC算法什么的。
而且其实说是一块区域,但其实堆完全可以处于物理上不连续的内存空间中,只要逻辑上连续即可,这个都是由jvm自己管理的,这个就像我们的磁盘,在实现的时候可以实现成固定大小或者可扩展的,主流虚拟机都是可扩展的。(见上图,-Xmx和-Xms参数)
如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。
那么请问,你能举出一个具体的OutOfMemoryError异常发生场景么?
————来自一次面试的小题
方法区 Method Area / PermGen
这里提一下方法区和永久代:
永久代是HotSpot的概念,方法区是Java虚拟机规范中的定义,是一种规范,而永久代是一种实现,一个是标准一个是实现。
对于Java8, HotSpots取消了永久代,取代永久代的就是元空间。元空间和新生代,老年代地址是连续的,属于本地内存;元空间存储类的元信息,静态变量和常量池等并入堆中。相当于永久代的数据被分到了堆和元空间中。
方法区也是各个线程共享的内存区域,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
java8之前,方法区十分的自由,可以选择不实现垃圾收集,而且和Java堆一样不需要连续的内存和可以选择固定大小或者可扩展。
但其实只是垃圾收集行为在这个区域比较少出现,但并非数据进入了方法区就如永久代的名字一样“永久”存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收“成绩”比较难以令人满意,尤其是类型的卸载,条件相当苛刻,但是这部分区域的回收确实是有必要的。所以方法区也是比较容易出现OutOfMemoryError异常。
程序计数器 Program Counter Register
程序计数器(Program Counter Register)是一块较小的内存空间,它的作用就是操作系统里的概念,即相当于指向当前线程所执行的字节码的行号的一个指向器。在虚拟机的概念模型里(仅是概念模型,各种虚拟机可能会通过一些更高效的方式去实现),字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间的计数器互不影响,独立存储,我们称这类内存区域为“线程私有”的内存。
如果线程正在执行的是一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是Natvie方法,这个计数器值则为空(Undefined)。
此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
JVM栈 JVM Stacks
与程序计数器一样,Java虚拟机栈(Java Virtual Machine Stacks)也是线程私有的,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧(Stack Frame)用于存储局部变量表、操作栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它不等同于对象本身,根据不同的虚拟机实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或者其他与此对象相关的位置)和returnAddress类型(指向了一条字节码指令的地址)。
其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
在Java虚拟机规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),当扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常。
本地方法栈(Native Method Stacks)
本地方法栈(Native Method Stacks)与虚拟机栈所发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的Native方法服务。虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(譬如Sun HotSpot虚拟机)直接就把本地方法栈和虚拟机栈合二为一。与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。