字节跳动_掌握Java字节码

字节跳动

字节跳动

嘿! 来临快乐:D我是ZeroTurnaround的技术布道者Simon Maple( @sjmaple) 。 您知道, JRebel伙计们! 由于编写了类似JRebel的产品,该产品与字节码进行交互的结果比您想像中的要多,因此我们想分享很多关于它的知识。

让我们从头开始……Java是一种旨在在虚拟机上运行的语言,因此只需要编译一次就可以在任何地方运行(是的,是的,一次编写,可以在任何地方进行测试)。 结果,您安装到系统上的JVM将是本机的,从而允许在其上运行的代码与平台无关。 Java字节码是您作为源编写的Java代码的中间表示,并且是编译代码的结果。 因此,您的类文件是字节码。

更简洁地说,Java字节码是Java虚拟机使用的代码集,该代码集在运行时被JIT编译为本机代码。

您曾经玩过汇编程序或机器代码吗? 从某种意义上说,字节码有点类似,但是行业内很多人并没有那么多地使用它,更多是出于缺乏必要性。 但是,了解正在发生的事情非常重要,如果您想让酒吧里的某个人望而却步,这很有用。

首先,让我们看一些字节码基础知识。 我们将首先使用表达式“ 1 + 2”,然后看看如何将其作为Java字节码执行。 1 + 2可以用反向波兰语表示为1 2 +。 为什么? 好吧,当我们将其放在堆栈上时,一切都变得清晰了……

1个

好的,在字节码中,我们实际上会看到操作码(iconst_1和iconst_2)和一条指令(iadd),而不是推和加,但流程是相同的。 实际指令的长度为一个字节,因此为字节码。 结果有256种可能的操作码,但仅使用了200种左右。 操作码的前缀是类型,后跟操作名称。 因此,我们之前在iconst和iadd上看到的是整数类型的常量和整数类型的加法指令。

这一切都很好,但是如何读取类文件。 通常,在打开的类文件中,通常在选择的编辑器中看到的只是一堆笑脸以及一些正方形,圆点和其他奇怪的字符,对吗? 答案是在Javap中,这是您随JDK实际获得的代码实用程序。 让我们看一个代码示例,看看运行中的javap。

public class Main {

    public static void main(String[] args){

        MovingAverage app = new MovingAverage();

    }

}

将此类编译为Main.class文件后,我们可以使用以下命令提取字节码:javap -c Main

Compiled from "Main.java"

public class algo.Main {
  public algo.Main();
       Code:
       0: aload_0
       1: invokespecial #1
       4: return
// Method java/lang/Object."<init>":()V
public static void main(java.lang.String[]);
     Code:
       0: new           #2
       3: dup
       4: invokespecial #3
       7: astore_1
      8: return 
}

我们可以立即在字节码中看到我们的默认构造函数和main方法。 顺便说一句,这就是Java为无构造函数的类提供默认构造函数的方式! 构造函数中的字节码只是对super()的调用,而我们的main方法创建了MovingAverage的新实例并返回。 #n字符实际上是指可以使用-verbose参数查看的常量,如下所示:javap -c -verbose Main。 返回内容的有趣部分如下所示:

public class algo.Main

  SourceFile: "Main.java"

  minor version: 0

  major version: 51

  flags: ACC_PUBLIC, ACC_SUPER

Constant pool:

   #1 = Methodref    #5.#21         //  java/lang/Object."<init>":()V

   #2 = Class        #22            //  algo/MovingAverage

   #3 = Methodref    #2.#21         //  algo/MovingAverage."<init>":()V

   #4 = Class        #23            //  algo/Main

   #5 = Class        #24            //  java/lang/Object

现在,我们可以将指令与常量进行匹配,并且可以将实际发生的事情拼凑起来要容易得多。 关于上面的示例,您还有什么困扰吗? 没有? 那每条指令前面的数字呢?

0: new           #2

       3: dup

       4: invokespecial #3

       7: astore_1

       8: return

现在真的很烦你,对吧? :)如果将这个方法体可视化为数组,这就是我们得到的:

2

请注意,每条指令都有一个十六进制表示,因此使用它我们实际上会看到以下内容:

3

如果在十六进制编辑器中打开它,我们实际上可以在类文件中看到它:

4

实际上,我们可以在HEX编辑器中更改字节码,但是老实说,这并不是您真正想做的事情,尤其是在强制性酒吧旅行之后的星期五下午。 更好的方法是使用ASM或javassist。

让我们从基本示例继续,添加一些存储状态并直接与堆栈交互的局部变量。 查看以下代码:

public static void main(String[] args) {

  MovingAverage ma = new MovingAverage();



  int num1 = 1;

  int num2 = 2;



  ma.submit(num1);

  ma.submit(num2);



  double avg = ma.getAvg();

}

让我们看看我们这次在字节码中得到了什么:

Code:
0: new  #2    // class algo/MovingAverage

3: dup

4: invokespecial #3  // Method algo/MovingAverage."<init>":()V

7: astore_1

8: iconst_1

9: istore_2

10: iconst_2

11: istore_3

12: aload_1

13: iload_2

14: i2d

15: invokevirtual #4        // Method algo/MovingAverage.submit:(D)V

18: aload_1

19: iload_3

20: i2d

21: invokevirtual #4        // Method algo/MovingAverage.submit:(D)V

24: aload_1

25: invokevirtual #5        // Method algo/MovingAverage.getAvg:()D

28: dstore     4



LocalVariableTable:

Start  Length  Slot  Name   Signature



0       31         0    args   [Ljava/lang/String;

8       23        1      ma     Lalgo/MovingAverage;

10      21         2     num1   I

12       19         3      num2   I

30       1        4    avg     D

看起来更有趣了……我们可以看到我们创建了一个类型为MovingAverage的对象,该对象通过astore_1指令(1是LocalVariableTable中的插槽号)存储在本地变量ma中。 指令iconst_1和iconst_2在那里将常量1和2加载到堆栈中,并分别通过指令istore_2和istore_3将它们存储在LocalVariableTable插槽2和3中。 一条加载指令将一个局部变量压入堆栈,一条存储指令从堆栈中弹出下一项并将其存储在LocalVariableTable中。 重要的是要意识到,当使用存储指令时,该项目将从堆栈中取出,如果您想再次使用它,则需要加载它。

执行流程如何? 我们所看到的只是从一行到下一行的简单进展。 我想在混合中看到一些BASIC风格的GOTO 10! 让我们再举一个例子:

MovingAverage ma = new MovingAverage();

for (int number : numbers) {

    ma.submit(number);

}

在这种情况下,当我们遍历for循环时,执行流程将跳很多次。 假定numbers变量是同一类中的静态字段,该字节码如下所示:

0: new #2 // class algo/MovingAverage

3: dup

4: invokespecial #3 // Method algo/MovingAverage."<init>":()V

7: astore_1

8: getstatic #4 // Field numbers:[I

11: astore_2

12: aload_2

13: arraylength

14: istore_3

15: iconst_0

16: istore 4

18: iload 4

20: iload_3

21: if_icmpge 43

24: aload_2

25: iload 4

27: iaload

28: istore 5

30: aload_1

31: iload 5

33: i2d

34: invokevirtual #5 // Method algo/MovingAverage.submit:(D)V

37: iinc 4, 1

40: goto 18

43: return



LocalVariableTable:

Start  Length  Slot  Name   Signature

30       7         5    number I 

12       31        2    arr$     [I

15       28        3    len     $I 

18       25         4     i$      I

0       49         0     args  [Ljava/lang/String;

8       41         1    ma     Lalgo/MovingAverage; 

48      1         2    avg    D

从位置8到17的指令用于设置循环。 SourceVariable表中有三个在源代码中没有真正提及的变量arr $,len $和i $。 这些是循环变量。 arr $存储number字段的参考值,从中得出循环长度len $。 i $是循环计数器,由iinc指令递增。

首先,我们需要测试我们的循环表达式,该表达式由比较指令执行:

18: iload 4

20: iload_3

21: if_icmpge 43

我们将4和4加载到堆栈上,分别是循环计数器和循环长度。 我们正在检查ID i $大于或等于len $。 如果是,则跳至语句43,否则继续进行。 然后,我们可以在循环中执行逻辑,最后,我们增加计数器并跳回到检查语句18的循环条件的代码。

37: iinc       4, 1       // increment i$

40: goto       18         // jump back to the beginning of the loop

可以在字节码中使用一堆算术操作码和类型命令组合,包括以下内容:

5

以及许多类型转换操作码,这些类型转换操作码在将整数分配给long类型的变量时很重要。

6

在我们的珍贵示例中,我们将一个整数传递给采用双精度值的submit方法。 Java语法为我们完成了此操作,但是在字节码中,您会看到使用了i2d操作码:

31: iload 5


33: i2d


34: invokevirtual #5 // Method algo/MovingAverage.submit:(D)V

因此,您已经做到了。 做得好,您已经喝咖啡了! 了解这些内容是否真的有用还是仅仅是怪胎? 好吧,两者都有! 现在,首先,您可以告诉您的朋友,您是可以处理字节码的JVM,其次,您可以更好地了解编写字节码时的操作。 例如,使用ObjectWeb ASM(这是使用最广泛的字节码操作工具之一)时,您会发现自己正在构建指令,并且这些知识将被证明是无价的!

如果您发现这有趣并且想了解更多,请查看ZeroTurnaround的JRebel产品负责人Anton Arhipov的免费Mastering Java Bytecode报告。 (JRebel使用javassist,我们学习了很多有趣的东西,并且可以与Java字节码进行交互!)该报告更深入地介绍了如何使用ASM。

谢谢阅读! 让我知道你的想法! ( @sjmaple )

参考:Java Advent Calendar博客上,从我们的JCG合作伙伴Attila Mihaly Balazs掌握Java字节码

翻译自: https://www.javacodegeeks.com/2013/12/mastering-java-bytecode.html

字节跳动

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值