文章目录
一、虚拟机栈的概述
虚拟机栈出现的背景:由于跨平台性的设计,java的指令都是根据栈来设计的。不同平台CPU架构不同,所以不能设计为基于寄存器的。
根据栈设计的优点是跨平台,指令集小,编译器容易实现,缺点是性能下降,实现同样的功能需要更多的指令。
栈是运行时的单位,而堆是存储的单位
-
栈解决程序的运行问题,即程序如何执行,或者说如何处理数据。堆解决的是数据存储的问题,即数据怎么放、放在哪儿。
-
一般来讲,对象主要都是放在堆空间的,是运行时数据区比较大的一块。
-
栈空间存放基本数据类型的局部变量,以及引用数据类型的对象的引用。
二、Java虚拟机栈的特点
- java虚拟机栈(Java Virtual Machine Stack),早期也叫Java栈。 每个线程在创建时都会创建一个虚拟机栈,其内部保存一个个的栈帧,对应一次次的java方法调用。(一个栈帧对应一个java方法)
- 它是线程私有的。
- 生命周期和线程是一致的。
- 栈是一种快速有效的分配存储方式,访问速度仅次于PC寄存器(程序计数器)
- 作用:主管java程序的运行,它保存方法的局部变量(8种基本数据类型、对象的引用地址)、部分结果,并参与方法的调用和返回。
-
局部变量:相较于成员变量(成员变量或称属性)
-
基本数据变量:8种基本数据类型
-
引用类型变量:类,数组,接口
-
- JVM直接对java栈的操作只有两个
-
每个方法执行,伴随着进栈(入栈,压栈)
-
执行结束后的出栈工作
- 对于栈来说不存在垃圾回收问题,但是肯定存在OOM异常。
三、栈中可能出现的异常
java虚拟机规范允许Java栈的大小是动态的或者是固定不变的。
如果采用固定大小的Java虚拟机栈,那每一个线程的java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过java虚拟机栈允许的最大容量,java虚拟机将会抛出一个 StackOverFlowError异常。(栈溢出)
public class StackErrorTest {
public static void main(String[] args) {
main(args);
}
}
//StackOverFlowError
如果java虚拟机栈可以动态拓展,并且在尝试拓展的时候无法申请到足够的内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,那java虚拟机将会抛出一个 OutOfMemoryError异常。(内存不足)
四、设置栈的内存大小
可以使用参数 -Xss 选项来设置线程的最大栈空间,栈的大小直接决定了函数调用的最大可达深度。 (IDEA设置方法:Run-EditConfigurations-VM options 填入指定栈的大小-Xss256k)
/**
* 演示栈中的异常:StackOverFlowError
* 默认情况下:count 10818
* 设置栈的大小: -Xss256k count 1872
*/
public class StackErrorTest {
private static int count = 1;
public static void main(String[] args) {
System.out.println(count);
count++;
main(args);
}
}
五、Java虚拟机栈的存储单位
-
每个线程都有自己的栈,栈中的数据都是以栈帧的格式存在。
-
在这个线程上正在执行的每个方法都对应各自的一个栈帧。
-
栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各种数据信息。
六、Java虚拟机栈的运行原理
-
JVM直接对java栈的操作只有两个,就是对栈帧的压栈和出栈,遵循先进后出/后进先出的和原则。
-
在一条活动线程中,一个时间点上,只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的,这个栈帧被称为当前栈帧,与当前栈帧对应的方法就是当前方法,定义这个方法的类就是当前类。
-
执行引擎运行的所有字节码指令只针对当前栈帧进行操作。
-
如果在该方法中调用了其他方法,对应的新的栈帧会被创建出来,放在栈的顶端,成为新的当前栈帧。
-
不同线程中所包含的栈帧是不允许相互引用的,即不可能在一个栈帧中引用另外一个线程的栈帧。
-
如果当前方法调用了其他方法,方法返回之际,当前栈帧会传回此方法的执行结果给前一个栈帧,接着,虚拟机会丢弃当前栈帧,使得前一个栈帧重新成为当前栈帧。
-
Java方法有两种返回函数的方式,一种是正常的函数返回,使用return指令;另外一种是抛出异常。不管使用哪种方式,都会导致栈帧被弹出。
七、栈帧的内部结构
每个栈帧中存储着:
- 局部变量表
- 操作数栈(或表达式栈)
- 动态链接(或指向运行时常量池的方法引用)
- 方法返回地址(或方法正常退出或异常退出的定义)
- 一些附加信息
1. 局部变量表
-
局部变量表也被称之为局部变量数组或本地变量表。
-
定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量这些数据类型包括各类基本数据类型、对象引用(reference),以及returnAddressleixing
-
由于局部变量表是建立在线程的栈上,是线程私有的数据,因此不存在数据安全问题。
-
局部变量表所需的容量大小是在编译期确定下来的,并保存在方法的Code属性的maximum local variables数据项中。在方法运行期间是不会改变局部变量表的大小的。
-
方法嵌套调用的次数由栈的大小决定。一般来说,栈越大,方法嵌套调用次数越多。对一个函数而言,他的参数和局部变量越多,使得局部变量表膨胀,它的栈帧就越大,以满足方法调用所需传递的信息增大的需求。进而函数调用就会占用更多的栈空间。
-
局部变量表中的变量只在当前方法调用中有效。在方法执行时,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁。
public void test() {
int a = 0;
{
int b = 0;
b = a+1;
}
//变量c使用之前以及经销毁的变量b占据的slot位置
int c = a+1;
}
在栈帧中,与性能调优关系最为密切的部分就是局部变量表。在方法执行时,虚拟机使用局部变量表完成方法的传递。
局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收。
静态变量与局部变量的对比及小结:
变量的分类:
- 按照数据类型分:
①基本数据类型;
②引用数据类型;
- 按照在类中声明的位置分:
①成员变量:在使用前,都经历过默认初始化赋值
- static修饰:类变量:类加载链接的准备preparation阶段给类变量默认赋0值——>初始化阶段initialization给类变量显式赋值即静态代码块赋值。
- 不被static修饰:实例变量:随着对象的创建,会在堆空间分配实例变量空间,并进行默认赋值
②局部变量:在使用前,必须要进行显式赋值的,否则,编译不通过
2. 操作数栈
-
栈 :可以使用数组或者链表来实现。
-
每一个独立的栈帧中除了包含局部变量表以外,还包含一个后进先出的操作数栈,也可以成为表达式栈。
-
操作数栈,在方法执行过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈(push)或出栈(pop)。
某些字节码指令将值压入操作数栈,其余的字节码指令将操作数取出栈,使用他们后再把结果压入栈。(如字节码指令bipush操作)
比如:执行复制、交换、求和等操作
操作数栈特点:
- 操作数栈,主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间。
- 操作数栈就是jvm执行引擎的一个工作区,当一个方法开始执行的时候,一个新的栈帧也会随之被创建出来,这个方法的操作数栈是空的。
- 每一个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的最大深度在编译器就定义好了,保存在方法的code属性中,为max_stack的值。
- 栈中的任何一个元素都是可以任意的java数据类型。
- 32bit的类型占用一个栈单位深度
- 64bit的类型占用两个栈深度单位
- 操作数栈并非采用访问索引的方式来进行数据访问的,而是只能通过标准的入栈push和出栈pop操作来完成一次数据访问。
- 如果被调用的方法带有返回值的话,其返回值将会被压入当前栈帧的操作数栈中,并更新PC寄存器中下一条需要执行的字节码指令。
- 操作数栈中的元素的数据类型必须与字节码指令的序列严格匹配,这由编译器在编译期间进行验证,同时在类加载过程中的类验证阶段的数据流分析阶段要再次验证。
- 另外,我们说Java虚拟机的解释引擎是基于栈的执行引擎,其中的栈指的就是操作数栈。
代码追踪:
public class OperandStackTest{
public void testAddOperation(){
byte i = 15;
int j = 8;
int k = i + j;
}
}
①15入栈 ②存储15,15进入局部变量表
注意:局部变量表的0号位被构造器(this)占用,这里的15从局部变量表1号开始
③压入8 ④8出栈,存储8进入局部变量表
⑤从局部变量表中把索引为1和2的数据取出来,放到操作数栈 ⑥iadd相加操作
⑦iadd操作结果23出栈⑧将23存储在局部变量表索引为3的位置上istore_3
栈顶缓存技术ToS(Top-of-Stack Cashing):
- 基于栈式架构的虚拟机所使用的零地址指令(即不考虑地址,单纯入栈出栈)更加紧凑,但完成一项操作的时候必然需要使用更多的入栈和出栈指令,这同时也就意味着将需要更多的指令分派次数和内存读/写次数。
- 由于操作数是存储在内存中的,因此频繁地执行内存读/写操作必然会影响执行速度。为了解决这个问题,HotSpot JVM的设计者们提出了栈顶缓存技术,将栈顶元素全部缓存在物理CPU的寄存器中,以此降低对内存的读/写次数,提升执行引擎的执行效率。
3. 动态链接(指向运行时常量池的符号引用)
- 每一个栈帧内部都包含一个指向运行时常量池或该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接。比如invokedynamic指令。
- 在Java源文件被编译成字节码文件中时,所有的变量和方法引用都作为符号引用保存在class字节码文件(javap反编译查看)的常量池里。比如:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用(#)最终转换为调用方法的直接引用。
- 运行时常量池位于方法区(注意: JDK1.7 及之后版本的 JVM 已经将运行时常量池从方法区中移了出来,在 Java 堆(Heap)中开辟了一块区域存放运行时常量池。)
为什么需要常量池呢?
常量池的作用,就是为了提供一些符号和常量,便于指令的识别。如果没有常量池就需要在每一个需要使用的位置都放上这个方法或属性的直接引用,而在不同的位置中都有可能调用这个方法或属性,没有必要在每个栈帧都放一个引用,这样会很占用空间,所以只要以符号引用的方式去常量池引用需要的结构就可以了。
4. 方法返回地址
- 存放调用该方法的PC寄存器的值。
- 一个方法的结束,有两种方式:
- 正常执行完成
- 出现未处理的异常,非正常退出
- 无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者(方法的调用者可能也是一个方法)的pc计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。而通过异常退出时,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。
- 本质上,方法的退出就是当前栈帧出栈的过程。此时,需要恢复上层方法的局部变量表、操作数栈、将返回值入调用者栈帧的操作数栈、设置PC寄存器值等,让调用者方法继续执行下去。
- 正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值。
八、虚拟机栈的相关面试题
- 举例栈溢出的情况?(StackOverflowError)
- 递归调用等,通过-Xss设置栈的大小
- 调整栈的大小,就能保证不出现溢出么?
- 不能 如递归无限次数肯定会溢出,调整栈大小只能保证溢出的时间晚一些,极限情况会导致OOM内存溢出(Out Of Memery Error)注意是Error。
- 分配的栈内存越大越好么?
- 不是,会挤占其他线程的空间
- 垃圾回收是否会涉及到虚拟机栈?
- 不会
- 方法中定义的局部变量是否线程安全?
- 具体情况具体分析
何为线程安全?
如果只有一个线程可以操作此数据,则必定是线程安全的。如果有多个线程操作此数据,则此数据是共享数据。如果不考虑同步机制的话,会存在线程安全问题。