【JVM原理探索,Java组件化架构实践

  • for循环和while循环这两条循环语句也是使用类似的方式来实现的,不同的是它们通常还包含一条goto指令,来达到循环的目的。

  • do-while循环不需要任何goto指令因为他们的条件分支位于字节码的尾部。更多的关于循环的细节可以查看loops section。

一些操作码可以比较两个整数或者两个引用,然后在一个单条指令中执行一个分支。其它类型之间的比较如double,long或float需要分为两步来实现。

首先,进行比较后将1,0或-1推送到操作数栈顶。接下来,基于操作数栈上值是大于,小于还是等于0执行一个分支。

首先,我们拿if-else语句为例进行讲解,其他用来进行分支跳转的不同的类型的指令将会被包含在下面的讲解之中。

if-else

下面的代码展示了一条简单的用来比较两个整数大小的if-else语句。


public int greaterThen(int intOne, int intTwo) {

    if (intOne > intTwo) {

        return 0;

    } else {

        return 1;

    }

} 

这个方法编译成如下的字节码:


0: iload_1

1: iload_2

2: if_icmple        7

5: iconst_0

6: ireturn

7: iconst_1

8: ireturn 

  • 首先, 使用iload_1和iload_2将两个参数推送到操作数栈

  • 然后, 使用if_icmple比较操作数栈栈顶的两个值

  • 如果intOne小于或等于intTwo,这个操作数分支变成字节码7,跳转到字节码指令行7line 。

注意,在Java代码中if条件中的测试与在字节码中是完全相反的,因为在字节码中如果if条件语句中的测试成功执行,则执行else语句块中的内容,而在Java代码,如果if条件语句中的测试成功执行,则执行if语句块中的内容。

换句话说,if_icmple指令是在测试如果if条件不为true,则跳过if代码块。if代码块的主体是序号为5和6的字节码,else代码块的主体是序号为7和8的字节码。

java_if_else_byte_code

下面的代码示例展示了一个稍微复杂点的例子,需要一个两步比较:


public int greaterThen(float floatOne, float floatTwo) {

    int result;

    if (floatOne > floatTwo) {

        result = 1;

    } else {

        result = 2;

    }

    return result;

} 

这个方法产生如下的字节码:


0: fload_1

 1: fload_2

 2: fcmpl

 3: ifle          11

 6: iconst_1

 7: istore_3

 8: goto          13

11: iconst_2

12: istore_3

13: iload_3

14: ireturn 

在这个例子中,首先使用fload_1和fload_2将两个参数推送到操作数栈栈顶。这个例子与上一个例子不同在于这个需要两步比较。 fcmpl首先比较floatOne和floatTwo ,然后将结果推送到操作数栈栈顶。如下所示:


floatOne > floatTwo -> 1



floatOne = floatTwo -> 0



floatOne < floatTwo -> -1 floatOne or floatTwo= Nan -> 1 

接下来,如果fcmpl的结果是<=0,ifle用来跳转到索引为11处的字节码。

  • 这个例子和上一个例子的不同之处还在于这个方法的尾部只有一个单个的return语句,而在if语句块的尾部还有一条goto指令用来防止else语句块被执行。

  • goto分支对应于序号为13处的字节码iload_3,用来将局部变量表中第三个slot中存放的结果推送扫操作数栈顶,这样就可以由return语句来返回。

java_if_else_byte_code_extra_goto

和存在进行数值比较的操作码一样,也有进行引用相等性比较的操作码比如==,与null进行比较比如 == null和 != null,测试一个对象的类型比如 instanceof。

  • if_cmp eq ne lt le gt ge 这组操作码用于操作数栈栈顶的两个整数并跳转到一个新的字节码处。可取的值有:

eq – 等于

ne – 不等于

lt – 小于

le – 小于或等于

gt – 大于

ge – 大于或等于 

  • if_acmp eq ne 这两个操作码用于测试两个引用相等(eq)还是不相等(ne),然后跳转到由操作数指定的新一个新的字节码处。

  • ifnonnull/ifnull 这两个字节码用于测试两个引用是否为null或者不为null,然后跳转到由操作数指定的新一个新的字节码处。

  • lcmp 这个操作码用于比较在操作数栈栈顶的两个整数,然后将一个值推送到操作数栈,如下所示:

如果 value1 > value2 -> 推送1 如果 value1 = value2 -> 推送0 如果 value1 < value2 -> 推送-1

fcmp l g / dcmp l g 这组操作码用于比较两个float或者double值,然后将一个值推送的操作数栈,如下所示:

如果 value1 > value2 -> 推送1 如果 value1 = value2 -> 推动0 如果value1 < value2 -> 推送-1

以l或g类型操作数结尾的差别在于它们如何处理NaN。

  • fcmpg和dcmpg将int值1推送到操作数栈而fcmpl和dcmpl将-1推送到操作数栈。这就确保了在测试时如果两个值中有一个为NaN(Not A Number),测试就不会成功。

    • 比如,如果x > y(这里x和y都为doube类型),x和y中如果有一个为NaN,fcmpl指令就会将-1推送到操作数栈。

    • 接下来的操作码总会是一个ifle指令,如果这是栈顶的值小于0,就会发生分支跳转。结果,x和y中有一个为NaN,ifle就会跳过if语句块,防止if语句块中的代码被执行到。

  • instanceof 如果操作数栈栈顶的对象一个类的实例,这个操作码将一个int值1推送到操作数栈。这个操作码的操作数用来通过提供常量池中的一个索引来指定类。如果这个对象为null或者不是指定类的实例则int值0就会被推送到操作数栈。

if eq ne lt le gt ge所有的这些操作码都是用来将操作数栈栈顶的值与0进行比较,然后跳转到操作数指定位置的字节码处。

如果比较成功,这些指令总是被用于更复杂的,不能用一条指令完成的条件逻辑,例如,测试一个方法调用的结果。

switch


一个Java switch表达式允许的类型可以为char,byte,short,int,Character,Byte,Short.Integer,String或者一个enum类型。为了支持switch语句。

Java虚拟机使用两个特殊的指令: tableswitch和lookupswitch ,它们背后都是通过整数值来实现的。仅使用整数值并不会出现什么问题,因为char,byte,short和enum类型都可以在内部被提升为int类型。

在Java7中添加对String的支持,背后也是通过整数来实现的。tableswitch通过速度更快,但是通常占用更多的内存。

tableswitch通过列举在最小和最大的case值之间所有可能的case值来工作。最小和最大值也会被提供,所以如果switch变量不在列举的case值的范围之内,JVM就会立即跳到default语句块。在Java代码没有提供的case语句的值也会被列出,不过指向default语句块,确保在最小值和最大值之间的所有值都会被列出来。

例如,执行下面的swicth语句:


public int simpleSwitch(int intOne) {

    switch (intOne) {

        case 0:

            return 3;

        case 1:

            return 2;

        case 4:

            return 1;

        default:

            return -1;

    } 

这段代码产生如下的字节码:


0: iload_1

1: tableswitch   {

         default: 42

             min: 0

             max: 4

               0: 36

               1: 38

               2: 42

               3: 42

               4: 40

    }

36: iconst_3

37: ireturn

38: iconst_2

39: ireturn

40: iconst_1

41: ireturn

42: iconst_m1

43: ireturn 

tableswitch指令拥有值0,1和4去匹配Java代码中提供的case语句,每一个值指向它们对应的代码块的字节码。tableswitch指令还存在值2和3,它们并没有在Java代码中作为case语句提供,它们都指向default代码块。当这些指令被执行时,在操作数栈栈顶的值会被检查看是否在最大值和最小值之间。如果值不在最小值和最大值之间,代码执行就会跳到default分支,在上面的例子中它位于序号为42的字节码处。为了确保default分支的值可以被tableswitch指令发现,所以它总是位于第一个字节处(在任何需要的对齐补白之后)。如果值位于最小值和最大值之间,就用于索引tableswitch内部,寻找合适的字节码进行分支跳转。

例如,值为,则代码执行会跳转到序号为38处的字节码。 下图展示了这个字节码是如何执行的:

java_switch_tableswitch_byte_code

如果在case语句中的值”离得太远“(比如太稀疏),这种方法就会不太可取,因为它会占用太多的内存。当switch中case比较稀疏时,可以使用lookupswitch来替代tableswitch。lookupswitch会为每一个case语句例举出分支对应的字节码,但是不会列举出所有可能的值。

  • 当执行lookupswitch时,位于操作数栈栈顶的值会同lookupswitch中的每一个值进行比较,从而决定正确的分支地址。使用lookupswitch,JVM会查找在匹配列表中查找正确的匹配,这是一个耗时的操作。而使用tableswitch,JVM可以快速定位到正确的值。

  • 当一个选择语句被编译时,编译器必须在内存和性能二者之间做出权衡,决定选择哪一种选择语句。下面的代码,编译器会使用lookupswitch:


public int simpleSwitch(int intOne) {

    switch (intOne) {

        case 10:

            return 1;

        case 20:

            return 2;

        case 30:

            return 3;

        default:

            return -1;

    }

} 

这段代码产生的字节码,如下:


0: iload_1

1: lookupswitch  {

         default: 42

           count: 3

              10: 36

              20: 38

              30: 40

    }

36: iconst_1

37: ireturn

38: iconst_2

39: ireturn

40: iconst_3

41: ireturn

42: iconst_m1

43: ireturn 

为了更高效的搜索算法(比线性搜索更高效),lookupswitch会提供匹配值个数并对匹配值进行排序。下图显示了上述代码是如何被执行的:

java_switch_lookupswitch_byte_code

String switch

在Java7中,switch语句增加了对字符串类型的支持。虽然现存的实现switch语句的操作码仅支持int类型且没有新的操作码加入。 字符串类型的switch语句分为两个部分完成。首先,比较操作数栈栈顶和每个case语句对应的值之间的哈希值 。 这一步可以通过lookupswitch或者tableswitch来完成(取决于哈希值的稀疏度) 。

这也会导致一个分支对应的字节码去调用String.equals()进行一次精确地匹配。一个tableswitch指令将利用String.equlas()的结果跳转到正确的case语句的代码处。


public int simpleSwitch(String stringOne) {

    switch (stringOne) {

        case "a":

            return 0;

        case "b":

            return 2;

        case "c":

            return 3;

        default:

            return 4;

    }

} 

这个字符串switch语句将会产生如下的字节码:


0: aload_1

 1: astore_2

 2: iconst_m1

 3: istore_3

 4: aload_2

 5: invokevirtual #2                  // Method java/lang/String.hashCode:()I

 8: tableswitch   {

         default: 75

             min: 97

             max: 99

              97: 36

              98: 50

              99: 64

       }

36: aload_2

37: ldc           #3                  // String a

39: invokevirtual #4                  // Method java/lang/String.equals:(Ljava/lang/Object;)Z

42: ifeq          75

45: iconst_0

46: istore_3

47: goto          75

50: aload_2

51: ldc           #5                  // String b

53: invokevirtual #4                  // Method java/lang/String.equals:(Ljava/lang/Object;)Z

56: ifeq          75

59: iconst_1

60: istore_3

61: goto          75

64: aload_2

65: ldc           #6                  // String c

67: invokevirtual #4                  // Method java/lang/String.equals:(Ljava/lang/Object;)Z

70: ifeq          75

73: iconst_2

74: istore_3

75: iload_3

76: tableswitch   {

         default: 110

             min: 0

             max: 2

               0: 104

               1: 106

               2: 108

       }

104: iconst_0

105: ireturn

106: iconst_2

107: ireturn

108: iconst_3

109: ireturn

110: iconst_4

111: ireturn 

这个类包含这段字节码,同时也包含下面由这段字节码引用的常量池值。了解更多关于常量池的知识可以查看JVM内部原理这篇文章的 运行时常量池 部分。


Constant pool:

  #2 = Methodref          #25.#26        //  java/lang/String.hashCode:()I

  #3 = String             #27            //  a

  #4 = Methodref          #25.#28        //  java/lang/String.equals:(Ljava/lang/Object;)Z

  #5 = String             #29            //  b

  #6 = String             #30            //  c



 #25 = Class              #33            //  java/lang/String

 #26 = NameAndType        #34:#35        //  hashCode:()I

 #27 = Utf8               a

 #28 = NameAndType        #36:#37        //  equals:(Ljava/lang/Object;)Z

 #29 = Utf8               b

 #30 = Utf8               c



 #33 = Utf8               java/lang/String

 #34 = Utf8               hashCode

 #35 = Utf8               ()I

 #36 = Utf8               equals

 #37 = Utf8               (Ljava/lang/Object;)Z 

注意,执行这个switch需要的字节码的数量包括两个tableswitch指令,几个invokevirtual指令去调用 String.equals()。 了解更多关于invokevirtual的更多细节可以参看下篇文章方法调用的部分 。下图显示了在输入“b”时代码是如何执行的:

如果不同case匹配到的哈希值相同,比如,字符串”FB”和”Ea”的哈希值都是28。这可以通过像下面这样轻微的调整equlas方法流来处理。注意,序号为34处的字节码:ifeg 42 去调用另一个String.equals() 来替换上一个不存在哈希冲突的例子中的 lookupsswitch操作码。


public int simpleSwitch(String stringOne) {

    switch (stringOne) {

        case "FB":

            return 0;

        case "Ea":

            return 2;

        default:

            return 4;

    }

} 

上面代码产生的字节码如下:


0: aload_1

 1: astore_2

 2: iconst_m1

 3: istore_3

 4: aload_2

 5: invokevirtual #2                  // Method java/lang/String.hashCode:()I

 8: lookupswitch  {

         default: 53

           count: 1

            2236: 28

    }

28: aload_2

29: ldc           #3                  // String Ea

31: invokevirtual #4                  // Method java/lang/String.equals:(Ljava/lang/Object;)Z

34: ifeq          42

37: iconst_1

38: istore_3

39: goto          53

42: aload_2

43: ldc           #5                  // String FB

45: invokevirtual #4                  // Method java/lang/String.equals:(Ljava/lang/Object;)Z

48: ifeq          53

51: iconst_0

52: istore_3

53: iload_3

54: lookupswitch  {

         default: 84

           count: 2

               0: 80

               1: 82

    }

80: iconst_0

81: ireturn

82: iconst_2

83: ireturn

84: iconst_4

85: ireturn 

循环


  • 条件流控制,比如,if-else语句和switch语句都是通过使用一条指令来比较两个值然后跳转到相应的字节码来实现的。了解更多关于条件语句的细节可以查看 conditionals section 。

  • 循环包括for循环和while循环也是通过类似的方法来实现的除了它们通常一个goto指令来实现字节码的循环。do-while循环不需要任何goto指令,因为它们的条件分支位于字节码的末尾。

  • 一些字节码可以比较两个整数或者两个引用,然后使用一个单个的指令执行一个分支。其他类型之间的比较如double,long或者float需要两步来完成。首先,执行比较,将1,0,或者-1 推送到操作数栈栈顶。接下来,基于操作数栈栈顶的值是大于0,小于0还是等于0执行一个分支。了解更多关于进行分支跳转的指令的细节可以 see above 。

while循环

while循环一个条件分支指令比如 if_fcmpge或 if_icmplt(如上所述)和一个goto语句。在循环过后就理解执行条件分支指令,如果条件不成立就终止循环。循环中最后一条指令是goto,用于跳转到循环代码的起始处,直到条件分支不成立,如下所示:


public void whileLoop() {

    int i = 0;

    while (i < 2) {

        i++;

    }

} 

被编译成:


0: iconst_0

 1: istore_1

 2: iload_1

 3: iconst_2

 4: if_icmpge       13

 7: iinc            1, 1

10: goto            2

13: return 

if_cmpge指令测试在位置1处的局部变量是否等于或者大于10,如果大于10,这个指令就跳到序号为14的字节码处完成循环。goto指令保证字节码循环直到if_icmpge条件在某个点成立,循环一旦结束,程序执行分支立即就会跳转到return指令处。iinc指令是为数不多的在操作数栈上不用加载(load)和存储(store)值可以直接更新一个局部变量的指令之一。在这个例子中,iinc将第一个局部变量的值加 1。

for循环

for循环和while循环在字节码层面使用了完全相同的模式。这并不令人惊讶因为所有的while循环都可以用一个相同的for循环来重写。上面那个简单的的while循环的例子可以用一个for循环来重写,并产生完全一样的字节码,如下所示:


public void forLoop() {

    for(int i = 0; i < 2; i++) {

    }

} 

do-while循环

do-while循环和for循环以及while循环也非常的相似,除了它们不需要将goto指令作为条件分支成为最后一条指令用于回退到循环起始处。

写在最后

很多人感叹“学习无用”,实际上之所以产生无用论,是因为自己想要的与自己所学的匹配不上,这也就意味着自己学得远远不够。无论是学习还是工作,都应该有主动性,所以如果拥有大厂梦,那么就要自己努力去实现它。

以上学习资料均免费放送,最后祝愿各位身体健康,顺利拿到心仪的offer!

由于文章的篇幅有限,所以这次的蚂蚁金服和京东面试题答案整理在了PDF文档里

资料获取方式:点赞+评论我的文章,关注我,然后戳这里即可免费领取

蚂蚁、京东Java岗4面:原理+索引+底层+分布式+优化等,已拿offer

蚂蚁、京东Java岗4面:原理+索引+底层+分布式+优化等,已拿offer

蚂蚁、京东Java岗4面:原理+索引+底层+分布式+优化等,已拿offer

用加载(load)和存储(store)值可以直接更新一个局部变量的指令之一。在这个例子中,iinc将第一个局部变量的值加 1。

for循环

for循环和while循环在字节码层面使用了完全相同的模式。这并不令人惊讶因为所有的while循环都可以用一个相同的for循环来重写。上面那个简单的的while循环的例子可以用一个for循环来重写,并产生完全一样的字节码,如下所示:


public void forLoop() {

    for(int i = 0; i < 2; i++) {

    }

} 

do-while循环

do-while循环和for循环以及while循环也非常的相似,除了它们不需要将goto指令作为条件分支成为最后一条指令用于回退到循环起始处。

写在最后

很多人感叹“学习无用”,实际上之所以产生无用论,是因为自己想要的与自己所学的匹配不上,这也就意味着自己学得远远不够。无论是学习还是工作,都应该有主动性,所以如果拥有大厂梦,那么就要自己努力去实现它。

以上学习资料均免费放送,最后祝愿各位身体健康,顺利拿到心仪的offer!

由于文章的篇幅有限,所以这次的蚂蚁金服和京东面试题答案整理在了PDF文档里

资料获取方式:点赞+评论我的文章,关注我,然后戳这里即可免费领取

[外链图片转存中…(img-psEfy7MT-1628507771108)]

[外链图片转存中…(img-WyDV2XJ3-1628507771111)]

[外链图片转存中…(img-LNtZrlvs-1628507771113)]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值