鸿蒙最全字节码插桩:从分析class文件结构开始(1),面试有问题答不上来正常吗

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 无符号数:基本数据类型,u1、u2、u4、u8分别表示1、2、4、8个字节的无符号数,无符号数可以用来表示数字、索引引用、数量只或者字符串(UTF-8编码)。
  • 表:由多个无符号数或者其他表作为数据项构成的复合数据类型,class文件中所有的表都以“_info”结尾。所以,整个 Class 文件可以认为就是一张表。

示例:

package org.ninetripods.lib_bytecode.asm.coreApi;

public class Test {
private int num = 0;

public void addNum() {
num++;
System.out.println(“num:” + num);
}

public static int staticAdd(int a, int b) {
return a + b;
}
}

经过javac 编译之后,会生成Test.class字节码文件,用010 Editor打开这个文件:

上述的字节码看上去有点乱,但其实是按顺序排列的,整理信息如下:

如我们常见的字节码文件都是以CAFEBABE开头,表示VM虚拟机要加载的是class字节码;紧跟着的0000表示的主副版本,再往后面的0037,用十进制表示为55,对应JDK 11等等。

继续使用 javap -c xxx.class命令可以 输出分解后的 java字节码

上述文件中描述了Test.class加载到内存时的执行顺序,包括各种描述符及操作码,接下面就来看一看它们。

类型描述符
基本类型描述符

每个基本类型都对应一个字母,如下:

基本类型描述符
byteB
shortS
intI
longJ
floatF
doubleD
charC
booleanZ
voidV
非数组的引用类型

使用L + 全限定名表示,示例:String -> Ljava/lang/String;

注:全限定名用于描述class类的名称,实际上就是把平时Java类名称中的"."换成了"/",如Java的祖先类java.lang.Object全限定名是:java/lang/Object

数组引用类型

使用[ + 数组内类型的描述符表示,示例:

int[] -> [I
String[][] -> [[Ljava/lang/String;

方法描述符

方法描述符用于class字节码文件中保存参数类型列表和返回值的方式。 方法描述符规则:

  • (参数列表)+ 返回值
  • 参数类型都为类型描述符
  • 参数列表中如果有多个参数,直接排列即可,不需要用逗号隔开

示例:

void test() -> ()V
void test(int i) -> (I)V
void test(String s, int i) -> (Ljava/lang/StringI)V

int[] test(double[], boolean) -> ([DZ)[I复制代码

OpCode操作码指令

OpCode用于VM虚拟机解释运行Java程序,每个操作码都可以用来表示一个指令。如0x62是一个十六进制数,表示两个float类型的数相加。在ASMorg.objectweb.asm.OpCodes类中可以找到: int FADD = 98ASM中是用十进制表示的,除此之外,其他操作码指令都可以在这个类中找到。

类操作码
  • new 创建对象时使用,如new String()对应 mv.visitTypeInsn(NEW, "java/lang/String") ,返回一个指定类型的对象。
  • instanceof 表示是否为指定类的对象,如 obj instanceof String 对应 mv.visitTypeInsn(INSTANCEOF, "java/lang/String"),返回一个布尔值结果。
  • checkcast ,用于检查对象的类型,如 (String) obji 对应 mv.visitTypeInsn(CHECKCAST, "java/lang/String"),返回类型检查后的对象。

注:上述的mv指的是MethodVisitorASM Core Api中的类,后面的文章会详细介绍),主要用于操作遍历、修改方法时使用。

字段操作码
  • getfield 用于获取非静态字段的值,对应ASM中的GETFIELD,如mv.visitFieldInsn(GETFIELD, xxxx)
  • putfield 用于修改非静态字段的值,对应ASM中的PUTFIELD,如mv.visitFieldInsn(PUTFIELD, xxxx)
  • getstatic 用于获取静态字段的值,对应ASM中的GETSTATIC,如mv.visitFieldInsn(GETSTATIC, xxxx)
  • putstatic 用于修改静态字段的值,对应ASM中的PUTSTATIC,如mv.visitFieldInsn(PUTSTATIC, xxxx)
方法操作码
  • invokevirtual 用于调用非静态方法,它是一种动态分派的调用指令,即引用类型并不能决定方法属于哪个类型。一般可以被重写的方法就用invokevirtual
  • invokespecial 用于调用非静态方法,主要用于<init>方法、私有方法、super.method()。因为这三类方法的调用对象在编译时就可以确定。调用方式如mv.visitMethodInsn(INVOKESPECIAL, "java/lang/Object", "equals", "(Ljava/lang/Object;)Z", false);
  • invokestatic 用于调用 static 静态方法。
  • invokeinterface 用于调用接口实例方法,如mv.visitMethodInsn(INVOKEINTERFACE, "java/util/List", "size", "()I", true);
  • invokedynamic 用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。
加载、存储等操作

虚拟机栈: 虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。 每一个栈帧中又包含了以下信息:

  • 局部变量表:表长度在编译阶段确定。调用方法时传递的参数,以及在方法内部创建的局部变量都保存在局部变量表中。
  • 操作数栈:也称为操作栈,是一个后入先出栈(LIFO),操作数栈的深度也是在编译阶段确定。当一个方法刚开始执行时,这个方法的操作数栈是空的,在方法执行过程中,会有各种字节码指令被压入和弹出操作数栈。
  • 动态链接:主要是为了支持方法调用过程中的动态连接。比如在一个方法中去调用其他方法。
  • 返回地址:用来帮助当前方法恢复它的上层方法执行状态。

下面的加载、存储相关操作都与操作数栈、局部变量表有关。通常程序需要将局部变量表的数据加载到操作数栈中,计算结束后再将结果存入局部变量表中

  • xload & xload_n (x = a/i/l/f/d, n表示加载对象的位置)

a 表示对象,I表示int, l表示long, f表示float, d表示double, b表示byte, c表示char, s表示short。 加载字节码,如aload_0,对应ASM中的mv.visitVarInsn(ALOAD, 0);

  • xstore & xstore_n (x = a/i/l/f/d,n表示加载对象的位置)

a 表示对象,I表示int, l表示long, f表示float, d表示double, b表示byte, c表示char, s表示short。 存储对象,如astore_1,对应ASM中的mv.visitVarInsn(ISTORE, 1);

  • xreturn (x = a/i/l/f/d) 返回操作码 返回操作码会将栈顶元素返回(返回某一对象或基本数据类型),并清空操作数栈。如:

mv.visitInsn(ARETURN); //对应某一对象(非基本类型) mv.visitInsn(RETURN); //无返回,对应void方法

  • dup 复制栈顶数据的操作码 用于复制栈顶元素并插入到栈中的操作码,可以节省xloadxstore的使用量。对应ASM中的DUPmv.visitInsn(DUP);DUP后紧接着的数字代表了复制数量,Xn代表插入到栈顶下第几层。如:

1、 DUP
输入:d3 d2 d1
输出:d3 d2 d1 d1

2、DUP2_X1
输入:d3 d2 d1
输出:d3 d2 d2 d1 d1

  • pop pop2 弹出栈顶操作码 用于栈操作的,比如调用了一个有返回值的方法,但是该返回值并不需要,可以使用POP。如:mv.visitInsn(POP)
  • swap 交换操作码 可以操作交换栈顶的两个操作数。
  • ldc & ldc_w & ldc2_w 读取常量池常量的操作码
  • bipush & sipush 整数常量操作码

bipush,属于byte范围(-128127) sipush,属于short范围(-3276832767) 对应ASM中: mv.visitIntInsn(BIPUSH, 100); mv.visitIntInsn(SIPUSH, 1000);

计算相关操作码
  • xneg、xadd、xsub、xmul 、xdiv、xrem、iinc(iinc_w) 分别为取反、加法、减法、乘法、除法、取余、自增操作法。

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!


img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上鸿蒙开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化的资料的朋友,可以戳这里获取

mg-FvfpREgv-1715522023060)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上鸿蒙开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化的资料的朋友,可以戳这里获取

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值