Dex文件格式相当简单,看下图:
上图是我从数据结构的角度画出来的Dex文件格式,每个数据结构在android源码dalvik/libdex目录下都有定义,关于上图有几点需要注意:
1. 图中所有以(encoded)标注的数据结构在文件中对应的数据都是经过Leb128编码的,详细的可以自己去查,编码规则:
- 以字节为单位,按照小端规则排列
- 每字节最高位为标志。如果最高位为1,表示有新字节,如果为0,表示字节序列结束
- 依次将剩下7位组合,顺序左移7位,生成整数。
2. DexCode结构中的debugInfoOff指向的是程序的debug数据,其中的parametersSize一定和DexCode中的insSize相同,表示的是函数的参数个数,而parametersSize字段后面会跟每个参数的名字对应的stringIdx值,这里只是参数的名字,每个参数对应的类型可以从该DexMethodId所对应的DexProtoId::parametersOff中去查找,因为Java函数调用也有传参规则,所以这两遍记录的参数顺序是相同的。另外需要注意的是,dalvik中每个java函数都会使用特定个数的寄存器,dalvik规定java函数在调用的时候,参数是放在后面N个寄存器的,比如一个函数使用5个寄存器(v0-v4),它有2个参数,那么这两个参数分别放在v3和v4。可以对照Dex文件所对应的smali文件来验证。
另外还有一点需要注意的是,对于非static函数,在所有的参数前面还有一个隐藏的参数this,它并没有保存在dex文件的debug数据中,但还是为它保留的相应的寄存器,需要自己注意。