@[TOC](JVM(三) —— 运行时数据区之程序计数器)
PC寄存器介绍
JVM中的程序计数器(Program Counter Register)中,Register的命名源于CPU的寄存器,寄存器存储指令相关的现场信息。CPU只有把数据装载到寄存器才能运行。
这里并非是广义上所指的物理寄存器,将其翻译成PC计数器(或指令计数器)会更加贴切(也称为程序钩子),并且也不容易引起一些不必要的误会。=JVM中的PC寄存器是对物理PC寄存器的一种抽象模拟。
PC寄存器的作用
PC寄存器用来存储指向下一条指令的地址,也即将要执行的代码。由执行引擎读取下一条指令。- PC寄存器是一块很小的内存空间,几乎可以忽略不计。也是运行速度最快的存储区域。
- 在JVM规范中,每个线程都有它自己的程序计数器,是线程私有的,生命周期与线程的生命周期保持一致。
- 任何时间的一个线程都只有一个方法在执行,也就是所谓的当前方法。程序计数器会存储当前线程正在执行的Java发放的指令地址;或者,如何是执行在native方法,则是未指定值(undefined)。
- 它是程序控制流的指示器,分支,循环,跳转,异常处理,线程恢复等基础功能都需要依赖这个计数器完成
- 字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令
- 它是一个没有GC发生的区域,也是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
PC寄存器使用举例
我们先在idea中写一段简单的代码:
public class Test {
public static void main(String[] args) {
int a = 10;
int b = 10;
int c = a + b;
}
}
然后重新编译一下代码:
这样我们的字节码文件就会存放在out目录下:
在终端下先进入编译后的class文件上一层目录,即 out/production/test
然后执行命令对class文件进行反编译:
javap -verbose Test.class
输出结果如下:
Classfile /F:/project/test/out/production/test/Test.class
Last modified 2022-10-12; size 423 bytes
MD5 checksum 2792c5efc464c8b7b7f705b724f9480f
Compiled from "Test.java"
public class Test
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #3.#21 // java/lang/Object."<init>":()V
#2 = Class #22 // Test
#3 = Class #23 // java/lang/Object
#4 = Utf8 <init>
#5 = Utf8 ()V
#6 = Utf8 Code
#7 = Utf8 LineNumberTable
#8 = Utf8 LocalVariableTable
#9 = Utf8 this
#10 = Utf8 LTest;
#11 = Utf8 main
#12 = Utf8 ([Ljava/lang/String;)V
#13 = Utf8 args
#14 = Utf8 [Ljava/lang/String;
#15 = Utf8 a
#16 = Utf8 I
#17 = Utf8 b
#18 = Utf8 c
#19 = Utf8 SourceFile
#20 = Utf8 Test.java
#21 = NameAndType #4:#5 // "<init>":()V
#22 = Utf8 Test
#23 = Utf8 java/lang/Object
{
public Test();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 3: 0
LocalVariableTable:
Start Length Slot Name Signature
0 5 0 this LTest;
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=4, args_size=1
0: bipush 10
2: istore_1
3: bipush 10
5: istore_2
6: iload_1
7: iload_2
8: iadd
9: istore_3
10: return
LineNumberTable:
line 5: 0
line 6: 3
line 7: 6
line 8: 10
LocalVariableTable:
Start Length Slot Name Signature
0 11 0 args [Ljava/lang/String;
3 8 1 a I
6 5 2 b I
10 1 3 c I
}
SourceFile: "Test.java"
Constant pool 指的是常量池。我们着重看一下main方法这一部分的东西:
bipush表示取一个10这个数据,
istore_1表示把10存储在索引为1的位置,
再取一个值10,
istore_2表示把10存储在索引为2的位置,
iload_1表示把索引为1的数据取出来,
iload_2表示把索引为2的数据取出来,
iadd表示把索引1和2的数据相加,
istore_3表示把结果存储在索引为3的位置,
return表示main方法返回结束。
然后我们把代码稍微改一下:
public class Test {
public static void main(String[] args) {
int a = 10;
int b = 10;
int c = a + b;
String s = "abc";
System.out.println(a);
System.out.println(c);
}
}
再进行反编译:
Classfile /F:/project/test/out/production/test/Test.class
Last modified 2022-10-12; size 611 bytes
MD5 checksum 1a5f167dc9476f607b1d19b471e5eb84
Compiled from "Test.java"
public class Test
minor version: 0
major version: 52
flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
#1 = Methodref #6.#26 // java/lang/Object."<init>":()V
#2 = String #27 // abc
#3 = Fieldref #28.#29 // java/lang/System.out:Ljava/io/PrintStream;
#4 = Methodref #30.#31 // java/io/PrintStream.println:(I)V
#5 = Class #32 // Test
#6 = Class #33 // java/lang/Object
#7 = Utf8 <init>
#8 = Utf8 ()V
#9 = Utf8 Code
#10 = Utf8 LineNumberTable
#11 = Utf8 LocalVariableTable
#12 = Utf8 this
#13 = Utf8 LTest;
#14 = Utf8 main
#15 = Utf8 ([Ljava/lang/String;)V
#16 = Utf8 args
#17 = Utf8 [Ljava/lang/String;
#18 = Utf8 a
#19 = Utf8 I
#20 = Utf8 b
#21 = Utf8 c
#22 = Utf8 s
#23 = Utf8 Ljava/lang/String;
#24 = Utf8 SourceFile
#25 = Utf8 Test.java
#26 = NameAndType #7:#8 // "<init>":()V
#27 = Utf8 abc
#28 = Class #34 // java/lang/System
#29 = NameAndType #35:#36 // out:Ljava/io/PrintStream;
#30 = Class #37 // java/io/PrintStream
#31 = NameAndType #38:#39 // println:(I)V
#32 = Utf8 Test
#33 = Utf8 java/lang/Object
#34 = Utf8 java/lang/System
#35 = Utf8 out
#36 = Utf8 Ljava/io/PrintStream;
#37 = Utf8 java/io/PrintStream
#38 = Utf8 println
#39 = Utf8 (I)V
{
public Test();
descriptor: ()V
flags: ACC_PUBLIC
Code:
stack=1, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
LineNumberTable:
line 3: 0
LocalVariableTable:
Start Length Slot Name Signature
0 5 0 this LTest;
public static void main(java.lang.String[]);
descriptor: ([Ljava/lang/String;)V
flags: ACC_PUBLIC, ACC_STATIC
Code:
stack=2, locals=5, args_size=1
0: bipush 10
2: istore_1
3: bipush 10
5: istore_2
6: iload_1
7: iload_2
8: iadd
9: istore_3
10: ldc #2 // String abc
12: astore 4
14: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream;
17: iload_1
18: invokevirtual #4 // Method java/io/PrintStream.println:(I)V
21: getstatic #3 // Field java/lang/System.out:Ljava/io/PrintStream;
24: iload_3
25: invokevirtual #4 // Method java/io/PrintStream.println:(I)V
28: return
LineNumberTable:
line 5: 0
line 6: 3
line 7: 6
line 9: 10
line 10: 14
line 11: 21
line 12: 28
LocalVariableTable:
Start Length Slot Name Signature
0 29 0 args [Ljava/lang/String;
3 26 1 a I
6 23 2 b I
10 19 3 c I
14 15 4 s Ljava/lang/String;
}
SourceFile: "Test.java"
再来看main方法这部分的内容:
比我们第一次执行多了几行代码:
先看数字10,ldc表示从常量池中取一个常量,#2
#2指向了#27,而#27代表了abc这个字符串。
数字12 对abc进行了一个保存。
数字14指向了#3,来看一下常量池:
这个表示的是我们的输出语句。
那前边的这些数字是什么呢?
这一列数字称为指令地址或者偏移地址,每个数字后边的分别是各自对应的操作指令,操作指令会在后边的篇章讲解,(这里先不做详细说明。)比如说5就存储在PC寄存器中,执行引擎就会在取出5对应的操作指令,主要是对局部变量表和操作数栈进行操作,存储引擎可以把操作指令翻译成机器指令,使得CPU进行处运算处理。
两个常见的问题
问题1:使用PC寄存器存储字节码指令地址有什么用呢?为什么使用PC寄存器记录当前线程的执行地址呢
因为CPU需要不停的切换哥哥线程,这时候切换回来以后,就得知道接着从哪里开始继续执行。
JVM字节码解释器就需要通过改变PC寄存器的值来明确下一条应该执行什么样的字节码指令。
问题二:PC寄存器为什么会被设定为线程私有?
我们都知道所谓的多线程在一个特定时间段内只会执行其中某一个线程的方法,CPU会不停的做任务切换没这样必然导致经常中断或者恢复,如何保证分毫无差呢?==为了能够准确地记录各个线程正在执行的当前字节码指令地址,最好的办法就是为每一个线程都分配一个PC寄存器。==这样一来各个线程之间便可以进行独立运算,从而不会出现相互干扰的情况。
由于CPU时间片轮限制,众多线程在并发执行过程中,任何一个确定的时刻,一个处理器或者多核处理器中的一个内核只会执行某个线程中的一条指令。
这样必然导致经常中断或恢复,如何保证分毫无差呢?每个线程在创建之后,都会产生自己的程序计数器和栈帧,程序计数器在各个线程之间互不影响。