Java内存区域
Java虚拟机在运行Java程序过程中管理的内存区域,称之为运行时数据区。
程序计数器
程序计数器(Program Counter Register)也叫PC寄存器,每个线程会通过程序计数器记录当前要执行的的字节码指令的地址。
- 在加载阶段,虚拟机字节码文件中的指令读取到内存之后,会将原文件中的偏移量转换成内存地址。每一条字节码指令都会拥有一个内存地址。在代码执行过程中,程序计数器会记录下一行字节码指令的地址。执行完当前指令之后,虚拟机的执行引擎根据程序计数器执行下条指令。
- 程序计数器可以控制程序指令的进行,实现分支、跳转、异常等逻辑
- 在多线程情况下,Java虚拟机需要通过程序计数器记录CPU切换前解释执行到那一句指令并继续解释运行。
程序计数器在运行中会出现内存溢出吗?
- 内存溢出指的是程序在使用某一块内存区域时,存放的数据需要占用的内存大小超过了虚拟机能提供的内存上限
- 因为每个线程只存储一个固定长度的内存地址,程序计数器是不会发生内存溢出的,所以程序员无需对程序计数器做任何处理。
栈
Java虚拟机栈(Java Virtual Machine Stack)采用栈的数据结构来管理方法调用中的基本数据,先进后出(First In Last Out) ,每一个方法的调用使用一个栈帧(Stack Frame)来保存。
Java虚拟机栈随着线程的创建而创建,而回收则会在线程的销毁时进行。由于方法可能会在不同线程中执行,所有每个线程都会包含自己的虚拟机栈。
Java虚拟机栈一个个栈帧组成,而栈帧由三部分组成,分别是局部变量表、操作数栈、本地帧数据
局部变量表
局部变量表的作用是在方法执行过程中存放所有的局部变量。编译成字节码文件时就可以确定局部变量表的内容。
public class Student {
public static void test() {
int a = 0;
long b = 1;
}
}
上诉代码对应的字节码指令:
//字节码指令
0 iconst_0
1 istore_0
2 lconst_1
3 lstore_1
4 return
如下图,第一列是编号,0表示的是局部变量a,第二列和第三列表示字节码指令的有效范围,如第一行表示从编号为2的字节码指令往后3条字节码指令也就是到编号为4的字节码指令有效。
接着第四列的序号则是槽的起始编号,栈帧中的局部变量表是一个数组,数组中每一个位置称之为槽(slot) , long和double类型占用两个槽,其他类型占用一个槽。
实例方法中的序号为0的位置存放的是this,指的是当前调用方法的对象,运行时会在内存中存放实例对象的地址。
public class Student {
public void test() {
int a = 0;
long b = 1;
}
}
方法参数也会保存在局部变量表中,其顺序与方法中参数定义的顺序一致。
局部变量表保存的内容有:实例方法的this对象,方法的参数,方法体中声明的局部变量
public class Student {
public void test(int x,int y) {
int a = 0;
long b = 1;
}
}
为了节省空间,局部变量表中的槽是可以复用的,一旦某个局部变量不再生效,当前槽就可以再次被使用。
public class Student {
public void test(int x,int y) {
{
int a = 0;
int b = 1;
}
{
int c = 1;
}
int i = 0;
long j = 1;
}
}
操作数栈
-
操作数栈是栈帧中虚拟机在执行指令过程中用来存放中间数据的一块区域。他是一种栈式的数据结构,如果一条指令将一个值压入操作数栈,则后面的指令可以弹出并使用该值。
-
在编译期就可以确定操作数栈的最大深度,从而在执行时正确的分配内存大小。
public void test() {
int x = 0;
int y = x + 1;
}
对应的字节码指令
0 iconst_0 // 将常量0放入操作数栈
1 istore_1 // 从操作数栈取出放入局部变量表1号位置
2 iload_1 // 将局部变量表1中的数据放入操作数栈
3 iconst_1 // 将常量1放入操作数栈
4 iadd // 将操作数栈顶部的两个数据进行累加,结果放入栈中
5 istore_2 // 从操作数栈取出放入局部变量表2号位置
6 return // 方法结束返回
帧数据
当前类的字节码指令引用了其他类的属性或者方法时,需要将符号引用(编号)转换成对应的运行时常量池中的内存地址。动态链接就保存了编号到运行时常量池的内存地址的映射关系。
方法出口指的是方法在正确或者异常结束时,当前栈帧会被弹出,同时程序计数器应该指向上一个栈帧中的下一条指令的地址。所以在当前栈帧中,需要存储此方法出口的地址 。也就是栈顶方法需要记录下一个方法执行到了哪一条指令,栈弹出之前把下个方法要执行的执行交给程序计数器。比如说下图中,demo方法是被test方法调用,就需要记录test方法执行到了 哪一条指令了。
异常表存放的是代码中异常的处理信息,包含了异常捕获的生效范围以及异常发生后跳转到的字节码指令位置
public void test() {
int a = 0;
try {
int b = 10 / a;
}catch (Exception e) {
a = 1;
}
}
本地方法栈
- Java虚拟机栈存储了Java方法调用时的栈帧,而本地方法栈存储的是native本地方法的栈帧。
- 在Hotspot虚拟机中,Java虚拟机栈和本地方法栈实现上使用了同一个栈空间。本地方法栈会在栈内存上生成一个栈帧,临时保存方法的参数同时方便出现异常时也把本地方法的栈信息打印出来
堆
一般Java程序中堆内存是空间最大的一块内存区域 ,创建出来的对象都存在堆上。栈上的局部变量表中可以存放堆上对对象的引用,通过静态变量就可以实现对象再线程之间的共享。
- 堆空间有三个需要关注的值:used、total、max
- used指的是当前已经使用的堆内存
- total是Java虚拟机已经分配的可用堆内存
- max是Java虚拟机可以分配的最大内存
随着堆中的对象增多,当total可以使用的内存即将不足时,Java虚拟机会继续分配内存给堆,如果堆内存不足,Java虚拟机就会不断的分配内存,total值会变大,total最多只能与max相等。
注意:并不是当 used = max = total的时候才会发生堆内存溢出
如果不设置任何的虚拟机参数, max默认是系统内存的1/4, total默认是系统内存的1/64。 **在实际应用中一般都需要设置total和max的值 **
Java服务端程序开发时, 建议将total和max设置为相同的值,这样在程序启动之后可使用的总内存就是最大内存,而无需向java虚拟机再次申请,减少了申请并分配内存时间上的开销,同时也不会出现内存过剩之后堆收缩的情况
方法区
方法区是存放基础信息的位置,线程共享,主要包含三部分:
- 类的元信息:保存了类的基本信息
- 运行时常量池:保存了字节码文件中的常量池内容
- 字符串常量池:保存了字符串常量
方法区是用来存放每个类的基本信息(元信息),一般称为InstanceKlass对象,在类的加载阶段完成
- 方法区除了存储类的元信息之外,还 存放了运行时常量池。常量池中存放的是字节码中的常量池的内容
- 字节码文件中通过编号查表的方式找到常量,这种常量池称为静态常量池。当常量池加载到内存中之后,可以通过内存地址快速的定位到常量池中的内容,这种常量池称为运行时常量池。
方法区是《Java虚拟机规范》 中设计的虚拟概念,每款Java虚拟机在实现上都各不相同。 Hotspot设计如下:
- JDK7将方法区存放在堆区域中的永久代空间,堆的大小由虚拟机参数
-XX:MaxPermSize=
值来控制 - JDK8将方法区存放在元空间中,元空间位于操作系统维护的直接内存中,默认情况下只要不超过操作系统承受的上限,可以一直分配。可以使用
-XX:MaxMetaspaceSize=
值将元空间最大大小进行限制
方法区也是会发送内存溢出的,当在方法区存放了大量的类的元信息,或者方法区大小设置不合理就可能出现内存溢出
字符串常量池
方法区中除了类的元信息、运行时常量池之外,还有一块区域叫字符串常量池(StringTable)。字符串常量池存储在代码中定义的常量字符串内容。比如“abc” 这个abc就会被放入字符串常量池。
public static void main(String[] args) {
String s1 = "abcd";
String s2 = "ab"+"cd";
String s3 = "ab";
String s4 = "cd";
String s5 = s3+s4;
String s6 = new String("abcd");
String s7 = "ab" + new String("cd");
System.out.println(s1 == s2);
System.out.println(s1 == s5);
System.out.println(s1 == s6);
System.out.println(s1 == s7);
}
对应输出
true
false
false
false
直接使用字符串 常量 进行拼接会在编译期间直接替换成一个字符串常量,而只要new了就会在堆上开辟一块内存空间,而两个对象进行拼接底层会优化成StringBuilder。
字符串常量池和运行时常量池有什么关系?
早期设计时,字符串常量池是属于运行时常量池的一部分,他们存储的位置也是一致的。后续做出了调整,将字符串常量池和运行时常量池做了拆分。
- JDK7之前运行时常量池逻辑包含字符串常量池,hotspot虚拟机对方法区的实现为永久代
- JDK7时字符串常量池被从方法区拿到了堆中,运行时常量池剩下的东西还在永久代
- JDK8以后,hotspot移除了永久代用元空间(Metaspace)取而代之, 字符串常量池还在堆
JDK7及之后版本中由于字符串常量池在堆上,所以intern () 方法会把第一次遇到的字符串的引用放入字符串常量池
JDK7及之后的版本中,静态变量是存放在堆中的Class对象中,脱离了永久代
直接内存
直接内存(Direct Memory) 并不在《Java虚拟机规范》 中存在,所以并不属于Java运行时的内存区域。在 JDK 1.4 中引入了 NIO 机制,使用了直接内存,主要为了解决以下两个问题:
- Java堆中的对象如果不再使用要回收,回收时会影响对象的创建和使用。
- IO操作比如读文件,需要先把文件读入直接内存(缓冲区)再把数据复制到Java堆中。现在直接放入直接内存即可,同时Java堆上维护直接内存的引用,减少了数据复制的开销。写文件也是类似的思路
如果需要手动调整直接内存的大小,可以使用-XX:MaxDirectMemorySize=
大小
小结
- 程序计数器:每个线程会通过程序计数器记录当
前要执行的的字节码指令的地址程序计数器可以控制程序指令的进行实现分支、跳转、异常等逻辑 - Java虚拟机栈:虚拟机栈采用栈的数据结构来管理方法调用中的基本数据(局部变量操作数等),每一个方法的调用使用一个栈顿来保存
- 堆:堆中存放的是创建出来的对象这也是最容易产生内存溢出的位置线
- 方法区:方法区中主要存放的是类的元信息同时还保存了常量池
JDK6运行时数据区域
JDK7运行时数据区域
JDK8运行时数据区域