虚拟机栈
1、概述
1.1、Java虚拟机栈是什么
Java虚拟机栈(Java Virtual Machine Stack),内部保存一个个栈帧(Stack Frame),对应一次次的Java方法调用。
线程私有的
生命周期和线程一致。
无GC,存在StackOverflowError和OOM
作用:主管Java程序的运行,保存局部变量、部分结果,并参与方法的调用和返回。
1.2、栈和堆的区别
- 从GC、OOM、StackOverflowError的角度。
栈中不存在GC,当固定大小的栈会发生OOM,动态的会发生StackOverflowError。
堆中GC、OOM、StackOverflowError都存在 - 堆栈的执行效率
栈的效率高于堆 - 内存大小,数据结构角度
一般堆的空间比栈的大
栈是一种FIFO先进后出的模型。堆中结构复杂,可以有链表、数组等 - 功能角度
栈是运行时的单位,栈解决程序的运行问题,即程序如何之星,或者说如何处理数据。
堆是存储的单位,堆解决的是数据存储的问题,即数据怎么放、放在哪。
1.3、常见异常与设置栈的大小
Java虚拟机规范允许Java栈的大小是动态的或者是固定不变的
- 如果采用固定大小的Java虚拟机栈,那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机栈允许的最大容量,Java虚拟机将会抛出一个StackoverflowError异常
public class StackDeppTest {
private static int count=0;
public static void recursion(){
count++;
recursion();
}
public static void main(String[] args) {
try {
recursion();
}catch (Throwable e){
System.out.println("deep of calling=" + count);
e.printStackTrace();
}
}
}
栈的大小直接决定了函数调用的最大可达深度
设置栈的大小:run -> edit Configuration -> Modify options -> java -> add VM options
-Xss256k
可以看到设置256k,调用深度为5000+;设置128k,调用深度为2500+。
- 如果Java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存,或者是在创建新的线程时就没有足够的内存去创建对应的虚拟机栈,那Java虚拟机将会抛出一个OutOfMemoryError异常
2、栈的存储单位(栈帧)
一个方法的执行对应一个栈帧(Stack Frame)入栈,方法结束,对应栈帧出栈。
正常返回,return;抛出异常(未处理异常),这两种情况都会导致栈帧被弹出。
栈帧:
- 局部变量表(Local Variables)
- 操作数栈(Operand stack),表达式栈
- 动态链接(Dynamic Linking):指向运行时常量池的方法引用
- 方法返回地址(Return Address):方法正常退出或者异常退出的定义
- 一些附加信息
3、局部变量表
3.1、概念
- 定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量(这些数据类型包括各种基本数据类型、对象引用(reference)以及return Address类型)
- 由于局部变量是建立在线程的栈上,是线程私有数据,因此不存在数据安全问题
- 局部变量表所需容量大小是在编译期确定下来的。(并保存在方法Code属性的maximum local variables数据项中,在方法运行期间不会改变局部变量表的大小的)
- 方法嵌套调用次数由栈大小决定,栈越大,方法嵌套调用次数越多。影响栈大小的主要因素是局部变量表。
- 局部变量表中的的变量只在当前方法调用中有效。
在方法执行时,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程。
当方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁。
import java.util.Date;
public class LocalVariablesTest {
private int count=0;
public static void main(String[] args) {
LocalVariablesTest test = new LocalVariablesTest();
int num=10;
test.test1();
}
public void test1(){
Date date = new Date();
String name1 = "atguigu.com";
test2(date,name1); //String info=
System.out.println(date+name1);
}
public String test2(Date dateP,String name2){
dateP =null;
name2="songhongkang";
double weight =130.5;
char gendar ='男';
return name2;
}
public void test4() {
int a = 0;
{
int b = 0;
b = a + 1;
}
//变量c,使用的是之前已经销毁的变量b占据的slot的位置
int c = a + 1;
}
}
3.2、Slot(变量槽)
-
局部变量表,最基本的存储单元是slot(变量槽)
-
在局部变量表中,32位以内的类型只占有一个slot(包括引用数据类型),64位类型(long和double)占有两个slot
byte、short、char在存储前被转换为int,boolean也被转换为int(0表示fasle,非0表示true)。
long和double则占据两个slot -
Jvm会为局部变量表中的每一个slot都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值
-
如果需要访问局部变量表中一个64bit的局部变量值时,只需要使用前一个索引即可(比如:访问long或double类型变量)
-
如果当前帧是由构造方法或者实例方法创建,那么该对象引用this将会放在index为0的slot处
-
栈帧中的局部变量表中的槽位是可以复用的,如果一个局部变量过了其作用域,那么在其作用域之后申请的新的局部变量就很可能会复用过期局部变量的槽位,从而节省资源的目的
-
与GC Roots的关系
局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收
3.3、静态变量与局部变量的对比
变量的分类:
按照数据类型分:①基本数据类型 ,②引用类型数据
按照在类中声明的位置分:
①成员变量:在使用前,都经历过默认初始化赋值。
类变量:Linking的prepare阶段:给类变量默认赋值—>initial阶段:给类变量显式赋值及给静态代码块赋值
实例变量:随着对象的创建,会在堆空间中分配实例变量空间,并进行默认赋值。
②局部变量:在使用前,必须要进行显式赋值!否则,编译不通过。
4、操作数栈
- Java虚拟机的解释引擎是基于栈的执行引擎,其中的栈指的就是操作数栈。
- 每一个独立的栈帧中除了包含局部变量表以外,还包含了一个后进先出的操作数栈,也可以称之为表达式栈
- 操作数栈,在方法执行过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈或出栈
- 操作数栈,主要用于保存计算机过程的中间结果,同时作为计算过程中变量临时的存储空间 必须掌握
- 当一个方法刚开始执行的时候,一个新的栈帧也会随之创建出来,这个方法的操作数栈是空的。
- 每一个操作数栈都会拥有一个明确的栈深度用于存储数值,其所需的最大深度在编译期就定义好了,保存在方法的Code属性中,为max_stack的值
- 栈中的任何一个元素都是可以任意的Java数据类型
32bit的类型占用一个栈单位深度
64bit的类型占用两个栈单位深度 - 如果被调用的方法带有返回值的话,其返回值将会被压入当前栈帧的操作数栈中,并更新PC寄存器中下一条需要执行的字节码指令
5、操作数栈的代码追踪
- 执行流程说明
public void testAddOperation(){
byte i = 15;
int j = 8;
int k = i + j;
}
- 操作数栈的最大深度说明
public class OperandStackTest {
public void testAddOperation(){
//byte、short、char、boolean:都以int型保存
byte i=15;
short j=8;
int k=i+j;
long m=12L;
int n=800;
//存在宽化类型转换
m=m*n;
}
}
- 带返回值的方法
public class OperandStackTest {
public int getSum(){
int m=10;
int n=20;
int k=m+n;
return k;
}
public void testGetSum(){
int i=getSum();
int j=10;
}
}
testGetSum()方法字节码解析:
参考资料:https://blog.csdn.net/dviewer/article/details/51138148
6、栈顶缓存技术
- 基于栈式架构的虚拟机所使用的零地址指令更加紧凑,但完成一项操作的时候必然需要使用更多的入栈和出栈指令,这同时也就意味着将需要更多的指令分派(instruction dispatch)次数和内存读/写次数。
- 由于操作数是存储在内存中的,因此频繁地执行内存读/写操作必然会影响执行速度。为了解决这个题,HotSpot JVM的设计者们提出了栈顶缓存(ToS,Top-of-Stack Cashing)技术,将栈顶元素全部缓存在物理CPU的寄存器中,以此降低对内存的读/写次数,提升执行引擎的执行效率。
基于寄存器的指令集架构:指令更少,执行速度快。
7、动态链接(或指向运行时常量池的方法引用)
- 每一个栈帧内部都包含一个指向运行时常量池(Constant pool)中该栈帧所属方法的引用。包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接(Dynamic Linking)。比如:invokedynamic指令
- 在Java源文件被编译成字节码文件中时,所有的变量和方法引用都作为符号引用(symbolic Refenrence)保存在class文件的常量池里(javap反编译查看)。比如:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用最终转换为调用方法的直接引用
- 常量池与运行时常量池
字节码文件中有个constant pool,就是常量池
当字节码文件被加载到内存中之后,方法区中会存放字节码文件的constant pool相关信息,这时候就成为了运行时常量池 - 为什么需要常量池呢?
常量池的作用,就是为了提供一些符号和常量,便于指令的识别。 - 符号引用与直接引用?
R大回答
深入理解java虚拟机
8、方法的调用:解析与分派
8.1、静态链接(早期绑定)与动态链接(晚期绑定)
-
静态连接(早期绑定):当一个字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期可知,且运行期保持不变时。这种情况下将调用方法的符号引用转换为直接引用的过程称之为静态链接
(invokestatic | invokespecial) -
动态链接(晚期绑定):如果被调用的方法在编译期无法被确定下来,也就是说,只能够在程序运行期将调用方法的符号引用转换为直接引用,由于这种引用转换过程具备动态性,因此也就被称之为动态链接。体现了多态
(invokevirtual | invokeinterface)
8.2、非虚方法与虚方法
- 非虚方法: 如果方法在编译器就确定了具体的调用版本,这个版本在运行时是不可变的。这样的方法称为非虚方法
(静态方法、私有方法、final方法、实例构造器(实例已经确定,this()表示本类的构造器)、父类方法(super调用)都是非虚方法) - 其他所有体现多态特性的方法称为虚方法
8.3、指令及相关代码
普通调用指令:
1.invokestatic:调用静态方法,解析阶段确定唯一方法版本;
2.invokespecial:调用<init>方法、私有及父类方法,解析阶段确定唯一方法版本;
3.invokevirtual:调用所有虚方法;
4.invokeinterface:调用接口方法;
动态调用指令(Java7新增):
5.invokedynamic:动态解析出需要调用的方法,然后执行 .
前四条指令固化在虚拟机内部,方法的调用执行不可人为干预,而invokedynamic指令则支持由用户确定方法版本。
其中invokestatic指令和invokespecial指令调用的方法称为非虚方法
其中invokevirtual(final修饰的除外,JVM会把final方法调用也归为invokevirtual指令,但要注意final方法调用不是虚方法)、invokeinterface指令调用的方法称称为虚方法。
/**
* 解析调用中非虚方法、虚方法的测试
*/
class Father {
public Father(){
System.out.println("Father默认构造器");
}
public static void showStatic(String s){
System.out.println("Father show static"+s);
}
public final void showFinal(){
System.out.println("Father show final");
}
public void showCommon(){
System.out.println("Father show common");
}
}
public class Son extends Father{
public Son(){
super();
}
public Son(int age){
this();
}
public static void main(String[] args) {
Son son = new Son();
son.show();
}
//不是重写的父类方法,因为静态方法不能被重写
public static void showStatic(String s){
System.out.println("Son show static"+s);
}
private void showPrivate(String s){
System.out.println("Son show private"+s);
}
public void show(){
//invokestatic
showStatic(" 大头儿子");
//invokestatic
super.showStatic(" 大头儿子");
//invokespecial
showPrivate(" hello!");
//invokespecial
super.showCommon();
//invokevirtual 因为此方法声明有final 不能被子类重写,所以也认为该方法是非虚方法
showFinal();
//虚方法如下
//invokevirtual
showCommon();//没有显式加super,被认为是虚方法,因为子类可能重写showCommon
info();
MethodInterface in = null;
//invokeinterface 不确定接口实现类是哪一个 需要重写
in.methodA();
}
public void info(){
}
}
interface MethodInterface {
void methodA();
}
8.4、静态类型语言与动态类型语言
JVM字节码指令集一直比较稳定,一直到java7才增加了一个invokedynamic指令,这是Java为了实现【动态类型语言】支持而做的一种改进
Java是静态类型语言(尽管lambda表达式为其增加了动态特性),js,python是动态类型语言
动态类型语言和静态类型语言两者的却别就在于对类型的检查是在编译期还是在运行期,满足前者就是静态类型语言,反之则是动态类型语言。
- 静态类型语言是判断变量自身的类型信息
- 动态类型语言是判断变量值的类型信息,变量没有类型信息,变量值才有类型信息
8.5、invokedynamic
interface Func{
public boolean func(String str);
}
public class Lambda {
public void lambda(Func func){
return;
}
public static void main(String[] args) {
Lambda lambda=new Lambda();
//invokedynamic
Func func=s->{
return true;
};
lambda.lambda(func);
lambda.lambda(s ->{
return true;
});
}
}
8.6、方法重写的本质
- 找到操作数栈顶的第一个元素所执行的对象的实际类型,记作 C
- 如果在类型 C 中找到与常量中描述符合、简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回 java.lang.IllegalAccessError异常。
- 否则,按照继承关系从下往上依次对 C 的各个父类进行第 2 步的搜索和验证过程。
- 如果始终没有找到合适的方法,则抛出 java.lang.AbstractMethodError异常。
java.lang.IllegalAccessError 介绍:
程序试图访问或修改一个属性或调用一个方法,这个属性或方法,你没有权限访问。一般的,这个会引起编译器异常。这个错误如果发生在运行时,就说明一个类发生了不兼容的改变。(常见:Maven jar包冲突)
8.7、虚方法表
作用:在面向对象的语言中,会频繁的使用动态分派,如果在每次动态分派的过程中都要在类的方法元数据中搜索合适的目标的话就可能影响到执行效率。因此,为了提高性能,JVM在类的方法区建立一个虚方法表(virtual method table),使用索引代替查找。
- 每个类都有一个虚方法表,表中存放各个方法的实际入口。
- 虚方法表什么时候创建?
虚方法表会在类加载的链接阶段被创建并开始初始化,类的变量初始值准备完毕之后,JVM会把该类的方法表也初始化完毕。
9、方法返回地址
-
是什么?有什么用?
存放调用该方法的PC寄存器的值,即调用该方法的指令的下一条指令的地址。
作用:为了恢复上层方法。 -
正常完成出口和异常完成出口及其区别。
①执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口。
②在方法执行过程中遇到了异常(Exception),并且这个异常没有在方法内进行处理,也就是只要在本方法的异常表中没有搜索到匹配的异常处理器,就会导致方法退出。简称异常完成出口。区别:通过异常完成出口退出的不会给上层调用者产生任何的返回值。
-
异常处理表
方法执行过程中抛出异常时的异常处理,存储在一个异常处理表,方便在发生异常的时候找到处理异常的代码。
10、一些附加信息
- 栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如,对程序调试提供支持的信息
11、栈的相关面试题
-
举例栈溢出的情况?
①举个简单的例子:在main方法中调用main方法,就会不断压栈执行,直到栈溢出;
②栈的大小可以是固定大小的,也可以是动态变化(动态扩展)的
如果是固定的,那么会抛出StackOverflowError
如果是动态扩展的,那么会抛出OOM异常(java.lang.OutOfMemoryError) -
调整栈大小,就能保证不出现溢出吗?
不能。因为调整栈大小,只会减少出现溢出的可能,栈大小不是可以无限扩大的,所以不能保证不出现溢出
-
分配的栈内存越大越好吗?
不是,因为增加栈大小,会造成每个线程的栈都变的很大,使得一定的栈空间下,能创建的线程数量会变小
-
垃圾回收是否会涉及到虚拟机栈?
不会;垃圾回收只会涉及到方法区和堆中,方法区和堆也会存在溢出的可能
程序计数器,只记录运行下一行的地址,不存在溢出和垃圾回收
虚拟机栈和本地方法栈,都是只涉及压栈和出栈,可能存在栈溢出,不存在垃圾回收 -
方法中定义的局部变量是否线程安全?
/**方法中定义的局部变量是否线程安全? 具体问题具体分析
* @author shkstart
* @create 15:53
*/
public class LocalVariableThreadSafe {
//s1的声明方式是线程安全的,因为线程私有,在线程内创建的s1 ,不会被其它线程调用
public static void method1() {
//StringBuilder:线程不安全
StringBuilder s1 = new StringBuilder();
s1.append("a");
s1.append("b");
//...
}
//stringBuilder的操作过程:是线程不安全的,
// 因为stringBuilder是外面传进来的,有可能被多个线程调用
public static void method2(StringBuilder stringBuilder) {
stringBuilder.append("a");
stringBuilder.append("b");
//...
}
//stringBuilder的操作:是线程不安全的;因为返回了一个stringBuilder,
// stringBuilder有可能被其他线程共享
public static StringBuilder method3() {
StringBuilder stringBuilder = new StringBuilder();
stringBuilder.append("a");
stringBuilder.append("b");
return stringBuilder;
}
//stringBuilder的操作:是线程安全的;因为返回了一个stringBuilder.toString()相当于new了一个String,
// 所以stringBuilder没有被其他线程共享的可能
public static String method4() {
StringBuilder stringBuilder = new StringBuilder();
stringBuilder.append("a");
stringBuilder.append("b");
return stringBuilder.toString();
/**
* 结论:如果局部变量在内部产生并在内部消亡的,那就是线程安全的
*/
}
}